University of Oulu

Social media mining for affective and business cues

Saved in:
Author: Bounab, Yazid1,2
Organizations: 1University of Oulu Graduate School
2University of Oulu, Faculty of Information Technology and Electrical Engineering, Computer Science and Engineering, Center for Machine Vision and Signal Analysis (CMVS)
Format: ebook
Version: published version
Access: open
Online Access: PDF Full Text (PDF, 2.2 MB)
Persistent link: http://urn.fi/urn:isbn:9789526237831
Language: English
Published: Oulu : University of Oulu, 2023
Publish Date: 2023-09-14
Thesis type: Doctoral Dissertation
Defence Note: Academic dissertation to be presented with the assent of the Doctoral Programme Committee of Information Technology and Electrical Engineering of the University of Oulu for public defence in Lecture hall Lo107, Linnanmaa, on 21 September 2023, at 2 p.m.
Tutor: Associate Professor Mourad Oussalah
Reviewer: Professor Victor Chang
Professor Allel Hadjali
Opponent: Professor David Camacho
Description:

Abstract

Social media has become part of everyday life and significantly contributed to the emergence of new social behavior that impact individuals, communities and business industry. This thesis contributes to the development of new natural language processing modules to uncover new insights from user generated content. Specifically, the thesis tackles five key research objectives. First, it seeks to comprehend the role of multimedia objects in stimulating users' responses in tourism sector by mapping the image quality with user's engagement and sentiment polarity. Second, it contributes to automatic text summarization of story-telling documents by providing a new framework to handle named-entity and co-referencing while keeping track of the semantic role labelling. Third, it provides a new framework for extending word-level semantic similarity to sentence-level similarity that helps in paraphrasing detection. Fourth, it provides a new deep learning framework using BERT architecture for cause detection that is applied in a business application, consisting of trade-barrier identification. Fifth, it suggests a new deep learning based model for online radicalization detection utilizing ERG22+ ontology. The thesis takes the Feynman's three-step methodology (setting up hypothesis, collecting relevant data and testing the hypothesis through experiments) as the primary methodology to achieve each of the five goals.

The thesis delivers new dataset (Tourism48), new natural language processing modules, and algorithms, which are made publicly available to scientific community.

see all

Tiivistelmä

Sosiaalisesta mediasta on tullut arkipäivän osa ja se on merkittävästi vaikuttanut uusien sosiaalisten käyttäytymistapojen syntyyn, jotka vaikuttavat yksilöihin, yhteisöihin ja liiketoimintaan. Tämä väitöskirja edistää uusien kielitieteellisten käsittelymoduulien kehittämistä käyttäjän luomaa sisältöä koskevien uusien näkökulmien paljastamiseksi. Erityisesti väitöskirja käsittelee viittä tärkeää tutkimustavoitetta. Ensinnäkin se pyrkii ymmärtämään monimediakohteiden roolin käyttäjien vastauksen herättämisessä matkailusektorilla kartoittamalla kuvanlaadun käyttäjän sitoutumisen ja tunteenpolariteetin kanssa. Toiseksi se edistää tarinankerronnallisten dokumenttien automaattista tiivistämistä tarjoamalla uuden raamin käsittelemään nimikkeitä ja viittauksia säilyttäen samalla semanttista roolimerkintää. Kolmanneksi se tarjoaa uuden raamin sanatasoisen semanttisen samankaltaisuuden laajentamiseksi lauseen tasoiseen samankaltaisuuteen, mikä auttaa parafrasoinnin havaitsemisessa. Neljänneksi se tarjoaa uuden syväoppimisraamin käyttäen BERT-arkkitehtuuria syiden havaitsemiseen, jota sovelletaan liiketoiminnan sovelluksessa, joka koostuu kaupan esteiden tunnistamisesta. Viidenneksi se ehdottaa uutta syväoppimisperustaista mallia verkko-radikaalisoinnin havaitsemiseen käyttäen ERG22+ ontologiaa. Väitöskirja käyttää Feynmanin kolmen vaiheen metodologiaa (hypoteesin asettaminen, relevanttien tietojen kerääminen ja hypoteesin testaaminen kokeiden avulla) päämetodologianaan saavuttaakseen jokaisen viidestä tavoitteesta.

Väitöskirja tarjoaa uuden datan (Tourism48), uusia kielitieteellisiä käsittelymoduuleja ja algoritmeja, joita on saatavilla tieteelliselle yhteisölle.

see all

Osajulkaisut / Original papers

Osajulkaisut eivät sisälly väitöskirjan elektroniseen versioon. / Original papers are not included in the electronic version of the dissertation.

  1. Bounab, Y., Seppänen, J., Savusalo, M., Mäkynen, R., & Oussalah, M. (2019). Sentence to sentence similarity : a review. Proceedings of the FRUCT’25, 439–443.

    Rinnakkaistallennettu versio / Self-archived version

  2. Bounab, Y., Adeegbe, J. M., & Oussalah, M. (2019). Towards storytelling automatic textual summerized. Proceedings of the FRUCT’25, 434–438.

    Rinnakkaistallennettu versio / Self-archived version

  3. Bounab, Y., Oussalah, M., & Beddiar, D. R. (2020). Impact of quality of images on users behavior on social media. 2020 Tenth International Conference on Image Processing Theory, Tools and Applications (IPTA), 9286466. https://doi.org/10.1109/IPTA50016.2020.9286466

    Rinnakkaistallennettu versio / Self-archived version

  4. Bounab, Y., Oussalah, M., & Ferdenache, A. (2020). Reconciling image captioning and user’s comments for urban tourism. 2020 Tenth International Conference on Image Processing Theory, Tools and Applications (IPTA), 9286602. https://doi.org/10.1109/IPTA50016.2020.9286602

    Rinnakkaistallennettu versio / Self-archived version

  5. Bounab, Y., & Oussalah, M. (2022). A new knowledge discovery approach for mining business trade barriers. Journal of Intelligent Information Systems, 59(3), 567–590. https://doi.org/10.1007/s10844-022-00701-z

    Rinnakkaistallennettu versio / Self-archived version

  6. Bounab, Y., & Oussalah, M. (2022). Radicalization and ERG22 in social media. Manuscript in preparation

see all

Series: Acta Universitatis Ouluensis. C, Technica
ISSN: 0355-3213
ISSN-E: 1796-2226
ISSN-L: 0355-3213
ISBN: 978-952-62-3783-1
ISBN Print: 978-952-62-3782-4
Issue: 895
Type of Publication: G5 Doctoral dissertation (articles)
Field of Science: 113 Computer and information sciences
Subjects:
Copyright information: © University of Oulu, 2023. This publication is copyrighted. You may download, display and print it for your own personal use. Commercial use is prohibited.