Automated multi-modal recognition of school violence |
|
Author: | Ye, Liang1,2 |
Organizations: |
1University of Oulu Graduate School 2University of Oulu, Faculty of Information Technology and Electrical Engineering, Computer Science and Engineering |
Format: | ebook |
Version: | published version |
Access: | open |
Online Access: | PDF Full Text (PDF, 1.9 MB) |
Persistent link: | http://urn.fi/urn:isbn:9789526237367 |
Language: | English |
Published: |
Oulu : University of Oulu,
2023
|
Publish Date: | 2023-08-11 |
Thesis type: | Doctoral Dissertation |
Defence Note: | Academic dissertation to be presented with the assent of the Doctoral Programme Committee of Information Technology and Electrical Engineering of the University of Oulu for public defence in the OP auditorium (L10), Linnanmaa, on 18 August 2023, at 12 noon |
Tutor: |
Professor Esko Alasaarela Professor Tapio Seppänen |
Reviewer: |
Professor Moncef Gabbouj Docent Jani Mäntyjärvi |
Opponent: |
Professor Heikki Ailisto |
Description: |
AbstractSchool bullying is a common social problem among teenagers that occurs in various ways, and physical violence is considered the most harmful. However, all the existing methods for reporting school violence are human-driven, making them inconvenient for victims to use. The author’s research group therefore aims to develop automatic violence recognition methods. First, this thesis proposed a Fuzzy Multi-Threshold algorithm. However, as more activities involving players of different ages and genders were added, it failed to perform effectively. A Proportional K-Nearest Neighbors algorithm was therefore proposed to address this issue, achieving an average recognition accuracy of 80%. Speech emotion recognition was then incorporated. Time- and frequency-domain motion features were extracted for activity recognition, while Mel Frequency Cepstrum Coefficients were extracted for emotion recognition. A Back Propagation Neural Network was used as the classifier, achieving an average accuracy of 87.8%. To further enhance recognition performance, an additional movement sensor was utilized. Motion features were separately extracted from each sensor. An improved Relief-F algorithm was proposed to select useful and low-redundancy motion features, while a Radial Basis Function neural network was used as the classifier. An improved Dempster-Shafer fusion algorithm was proposed to combine the classification results of each sensor. An average recognition accuracy of 93.6% was achieved. To address the problem of bullies removing wearable sensors, an image-based violence recognition was proposed. Surveillance cameras capture images, and target-detecting algorithms and morphological processing methods were utilized to detect foreground targets. A circumscribed rectangular frame (CRF) integration method was proposed to refine the detected targets. CRF features and optical flow features were extracted, and three different selection methods were employed to select useful features. A Decision Tree – Support Vector Machine classifier was designed, achieving an average recognition accuracy of 97.6%. In summary, this thesis proposed two primary methods for recognizing school violence: movement-sensor-based; and surveillance camera-based. Both methods demonstrated satisfactory recognition results, suggesting the potential for the automatic detection of incidents of school violence. see all
TiivistelmäKoulukiusaaminen on teini-ikäisten yleinen sosiaalinen ongelma, ja sitä tapahtuu monin tavoin fyysisen väkivallan ollessa vahingollisin. Nykyiset kouluväkivallasta ilmoittamisen menetelmät ovat kuitenkin uhrin aloitteeseen perustuvia ja näin ollen epämukavia käyttää. Tässä tutkimustyössä kehitetään kouluväkivallan tunnistamismenetelmiä, jotka havaitsevat kiusaamistapahtumat automaattisesti. Työssä kehitettiin ensin Fuzzy Multi-Threshold -algoritmi, joka kykeni luokittelemaan seitsemän erityyppistä fyysistä aktiviteettia. Ratkaisu kuitenkin menetti tarkkuuttaan, kun aineistoa laajennettiin eri-ikäisillä ja erisukupuolisilla koehenkilöillä. Seuraavaksi kehitettiin Proportional K-Nearest Neighbors -algoritmi ja tuloksena oli 80 % tunnistamistarkkuus. Ratkaisuun lisättiin emootion tunnistus puhesignaalista. Fyysisen aktiivisuuden piirteet laskettiin liikesignaalin aika- ja taajuusalueista ja puheäänen Mel Frequency Cepstrum Coefficients -piirteet laskettiin tunteiden tunnistamiseksi. Back Propagation -neuroverkko antoi tunnistustarkkuudeksi 87,8 %. Ratkaisuun lisättiin toinenkin liikeanturi ja piirteet laskettiin molemmista anturisignaaleista. Työssä kehitettiin parannettu Relief-F-algoritmi parhaiden piirteiden valintaan liikkeen ominaisuuksista. Luokittelijana käytettiin Radial Basis Function -neuroverkkoa. Anturien tuottamien signaalien luokittelutulosten yhdistäminen tehtiin Dempster-Shafer-fuusioalgoritmilla, jolloin saavutettiin 93,6 % luokittelutarkkuus. Koska on mahdollista, että kiusaajat poistavat puettavat anturit tai älypuhelimet, kehitettiin vaihtoehtoinen tapa tunnistaa kouluväkivalta videokuvien perusteella. Valvontakameran kuvan edustassa sijaitsevien kohteiden paikantamiseksi käytettiin kohteen havaitsemisalgoritmeja ja morfologisia operaatioita. Kohteen ympäröivälle suorakaiteelle laskettiin kuvapiirteet sisältäen optisen virtauksen piirteet, ja niistä valittiin parhaat kolmella eri piirteenvalintamenetelmällä. 2-kerroksinen luokittelija Decision Tree – Support Vector Machine -tekniikka tuotti tunnistustarkkuuden 97,6 %. Yhteenvetona, tässä työssä kehitettiin kaksi vaihtoehtoista menetelmää tunnistaa kouluväkivalta, eli liiketunnistimeen ja puheäänen analyysiin perustuva sekä valvontakameraan perustuva. Kehitetyt ratkaisut tarjoavat mahdollisuuden havaita kouluväkivallan tapahtumat automaattisesti ja suojata näin teini-ikäisiä kouluväkivallalta. see all
Osajulkaisut / Original papersOsajulkaisut eivät sisälly väitöskirjan elektroniseen versioon. / Original papers are not included in the electronic version of the dissertation.
see all
|
Series: |
Acta Universitatis Ouluensis. C, Technica |
ISSN: | 0355-3213 |
ISSN-E: | 1796-2226 |
ISSN-L: | 0355-3213 |
ISBN: | 978-952-62-3736-7 |
ISBN Print: | 978-952-62-3735-0 |
Issue: | 890 |
Type of Publication: |
G5 Doctoral dissertation (articles) |
Field of Science: |
213 Electronic, automation and communications engineering, electronics |
Subjects: | |
Funding: |
This thesis was supported by the University of Oulu Scholarship Foundation, the China Scholarship Council, and the National Natural Science Foundation of China under Grant No. 61602127. |
Copyright information: |
© University of Oulu, 2023. This publication is copyrighted. You may download, display and print it for your own personal use. Commercial use is prohibited. |