SNSの誹謗文検出のための伝搬ネットワーク手法

Přispěvatelé: 山田, 俊行
Jazyk: japonština
Rok vydání: 2023
Popis: 近年,Twitter などのSNS は人々の生活に浸透し,それに伴いSNS 上の誹謗中傷は深刻な社会問題になっている.SNS での誹謗中傷は匿名性が高く,ユーザ情報の開示が困難である.そのため,誹謗中傷による被害を事前に防ぐために,投稿をフィルタリングするといった方法が考えられる.Twitter ではNG ワードの設定によるフィルタリングや,誹謗にあたるツイート,それを投稿するユーザを運営に報告するといった方法が取られる.しかし,これらの方法は人手で行われるため,大量の誹謗ツイートを取捨する負担と,実際にそれらの文書に目を通して判別する負担がかかる.これらのことから,誹謗にあたる投稿を自動で検出できることが求められる.誹謗文書を検出する自然言語処理の手法では,ある単語が他者を誹謗するものかを独自に定義した辞書を用いて判別する手法がある.また,SNS における特定文書の検出やパーソナルデータを用いる研究では,SVM などの分類器を用いた手法がある.SVM では特徴量を用いて大量のデータから検出対象のパターンを見つけることが期待される.しかし,これらの手法は投稿された文書間のつながりや,投稿したユーザ自身の情報などのSNS 特有の情報を特徴量として考慮しづらい.また,自然言語の単語を特徴量とする場合,特定の単語に分類結果が左右されるといった問題がある.そこで本研究では,SNS 特有の情報を考慮した誹謗文書の検出精度の向上を目標とし,SVM と伝搬ネットワークを用いた手法を提案する.また今回はTwitter を対象に考察,実験を行う.本研究で提案する伝搬ネットワークでは,複数のツイート(文書) とそのツイートを投稿したユーザの2 種類のノードを持ち,各ノードには誹謗度を与える.ツイートの誹謗度はそのツイートが他者を誹謗している度合,ユーザの誹謗度はそのユーザが他者を誹謗するツイートを投稿する度合を指す.各ノードの誹謗度をネットワーク上で複数回伝搬させて値を更新,更新後の誹謗度からそのツイートが他者を誹謗しているかどうかを判定する.この手法によって,SVM だけでは考慮できないツイート,ユーザ間のつながりなどのSNS特有の情報を扱える.実験と評価のために,提案手法の定式化と実装,ツイートのデータセットの収集と作成をした.また,これらを用いて提案手法の個々のパラメーターの調整をした.評価実験では,検出の正確性を指す正解率や適合率,検出の網羅性を指す再現率を用いた.提案手法ではSVM のみの分類結果と比較し,正解率の低下を0.07,適合率の低下を0.03 以下に抑えつつ,再現率を0.2 以上増加させていることを確認できた.
三重大学大学院 工学研究科 博士前期課程 情報工学専攻 コンピュータソフトウェア研究室
28p
Databáze: OpenAIRE