搜尋本站文章

2011年7月31日 星期日

Twitter 中是男?是女?可能你的用詞習慣出賣了你!

許多網友多以假名掩蓋身份,雌雄難辯,男扮女女扮男屢見不鮮,然而他們的言語和喜好會暴露他們的身份。Mitre 公司的語言學研究人員,在蘇格蘭舉行的自然語言處理實證方法會議上公佈了一篇論文(點擊下載,當然是英文的),稱他們開發出一種算法能根據 Twitter 用戶的帖子內容識別出其性別,他們的依據是女性所用語言和男性存在相當大的差異。

究竟是什麼差別呢?

研究發現,女性比男性更常使用表情符號、縮略語,重複字母和情感表達。

如果一個 Twitter 帖子包含了感嘆號或笑臉符號,那麼有很大可能性發帖者是女性。例如,女性常用單詞包括:haha、cute、omg、love、yaha、yay、hahaha、happy、girl、 hair,、lol、hubby 和 chocolate。而男性喜好用 google 和 http。

研究人員開發的程序識別性別的正確率有 65.9%(多悲情的數字)!

===============================================

創用 CC 授權條款
Related Posts Plugin for WordPress, Blogger...

沒有留言:

張貼留言

1、本留言處歡迎多加留言交流,但不歡迎垃圾留言及廣告留言
2、留言時可以使用部份 HTML 標記
3、對於教學文章介紹或軟體使用有問題歡迎提出,若站長沒回應表示不清楚該問題的解決方案
4、留言時請勿留下電子郵件,以免因搜尋引擎爬文而造成您的困擾,且站長不會寄相關郵件給您,僅會在留言區提供解決方案
5.站長保留不當刪除留言的權力,若造成不便尚請見諒