Linking Social Network and Resume by Using Machine Learning
Autor: | Eina, Hashimoto, Natsumi, Miyazaki, Masatsugu, Ichino, Tetsuji, Kuboyama, Isao, Echizen, Hiroshi, Yoshiura |
---|---|
Jazyk: | japonština |
Rok vydání: | 2017 |
Předmět: | |
Zdroj: | 情報処理学会論文誌. 58(12):1863-1874 |
ISSN: | 1882-7764 |
Popis: | ソーシャルネットワークのプライバシリスクの明確化および悪用の抑止のために,匿名のソーシャルネットワークアカウントを組織が保有する履歴書と照合する手法を述べる.提案手法は機械学習を用い,履歴書に含まれる性別,趣味などの属性値ごとに,ソーシャルネットワークアカウントの投稿文が当該属性値を持つ人によって書かれたものかを判定する.この属性値ごとの識別器を組み合わせることにより,ソーシャルネットワークの投稿文が履歴書の当人によって書かれたものであるかを判定する.機械学習のための訓練データはソーシャルネットワーク上の他のアカウントから収集する.30人の被験者のソーシャルネットワークアカウントと履歴書を用い,投稿文の特徴量を2種類,機械学習アルゴリズムを5種類,履歴書中の着目する属性群3セット,属性ごとのスコアの統合方法2種類により,提案手法を評価した.その結果,最良ケースにおいて,30アカウント中5アカウントは本人の履歴書と正しく照合でき,14アカウントは30人中3人に絞り込むことができ,19アカウントは6人に絞り込むことができた. This paper describes a method that links anonymous accounts of social networks to resumes held by organizations. Using machine learning, the proposed method generates a classifier for each attribute value described in each resume, such as gender of female and hobby of dancing. It uses each classifier to judge posts in an account were written by a person who has such an attribute value. By combining scores from these resumes, the method judges the posts were written by a person of the resume. Training data for machine learning are collected from other accounts of the social network. The proposed method was evaluated by using 30 pairs of accounts and resumes with 2 kinds of sentence feature, 5 machine learning algorithms, 3 sets of resume attributes, and two methods of score fusion. In the best combination of parameters, the correct resumes were identified for 5 accounts, they were in 3 identified resumes for 14 accounts and in 6 identified resumes for 19 accounts. |
Databáze: | OpenAIRE |
Externí odkaz: |