WIRED VISION / 文章の特徴を分析して個人を特定するプログラム
オンラインでは匿名だから、勝手なことを書きこんでもバレっこないとお思いの読者も多いだろう。だがやはり身許が特定される恐れはある。日本語文書の場合、「用語的な特徴や意味論的な特徴」に加えて漢字の変換候補の選び方や誤記・誤変換のクセなど、本人特定に繋がる情報は更に多そうだ。「ふいんき」とか使ってる場合ではない。いやだやだ。
アリゾナ大学人口知能研究所では、米連邦政府の資金援助を受けて、インターネット上の人々の動きを、その人の書き癖から追跡する方法を確立しようとしている。
全米科学財団(NSF)のプレスリリースによると、アリゾナ大学のきわめて野心的な『Dark Web』プロジェクトは、「テロリストが作成したすべてのウェブ・コンテンツを系統立てて収集、分析することを目的」としている。
『Arizona Daily Star』紙の記事によると、この「分析」には、「執筆者1人1人を、文章のスタイルから特定し、追跡する」プログラムが用いられているという。
匿名ブログ愛好家が本人特定から自衛するために、語尾や仮名遣いなどの表記の揺れを自動的に加えるユーティリティが出現したりするのだろうか。あと本人の論旨と正反対の傾向の文書を自動的に作成するジェネレータとかね。大事なメッセージは縦読みで書かねばならなくなったりするのかも。
かくしてネット上情報のS/N比は更に悪化するのだった。

