超久々に書いてみる。
このところ、右派の超有名アカウントのDappiが話題になっている。小西議員がDappiを名誉棄損で告訴するために開示請求したところ、対象が法人である事が判明したのを発端に、「法人業務として数々の名誉棄損書き込み、野党攻撃書き込み、差別書き込みを行ってきたのか!?」となったからである。
法人なんだろうなぁとはこれまでも書き込みの時間などから薄々言われていた事ではあるが、これで「あっ! やっぱりそうだったんだ」と疑惑が確信に変わったというわけである。
朝日新聞が報じただけでなく、国会の質問でも取り上げられ、昨日はついに報道特集に企画が組まれた。いよいよメジャーメディアが取り上げるレベルの、センセーショナルな話題になったと言える。
Dappiについて言及している、この1週間くらいのツイートを引っこ抜いてみた
Dappiは結局何者なのか、彼が誰から委託を受けてあのような書き込みの数々を行ったのか等は、これから各メディアが追いかけていくだろう。
自分はどちらかというと、「Dappiについて言及するネトウヨ」について掘り下げていきたい。とりあえず掘り下げるためのネタとしてはタイトル通り、Dappiについて言及している、この1週間くらいのツイートを引っこ抜いてみた。
サイズは39MB程度あるので、若干落とすのに時間かかるかもしれない。皆さんもぜひ活用し、掘り下げをやってみてほしい。
引っこ抜き方
最近はPythonを使う事が多いので、Twintというツールを使って引っこ抜いた。所謂スクレイピングツールである。
使い方は、Pythonをインストールし、Twintをインストールし、Twintを呼び出すコードを書いて、実行するだけである。
Pythonのインストール方法
下記リンクに記載の通りにインストールを行う。
Twintのインストール方法
コマンドプロンプトを立ち上げ、下記コマンドを張り付けてEnterキーを押す。
Twintの実行コードの書き方
メモ帳を立ち上げて、下記コードをコピペして、適当なPythonのファイル名(例えばdappi.py)で保存する。
c.Sinceとc.Untilで取得期間を指定でき、c.Searchで検索文字を指定できる。取得期間は1週間程度にしているが、基本的にあまり昔のものは掘れなさそうである。c.Searchは、「ダッピ」「脱皮」などにしてみても良いだろう。その他の細かいオプションについては、下記リンクの公式Wikiを参照。
実行方法
下記コマンドを実行する。すると、実行コードを置いた場所にCSVファイルで実行結果が吐き出される。
その他
吐き出されたCSVファイルの文字コードはUTF-8なので、Excelで開きたいときは前もって文字コードをSJISに変換する事(そうしないと文字化けする)。
文字コード変換の方法は山ほどあるのでググってほしい。自分はサクラエディタで開いて文字コードを変えて保存するという原始的な方法でやっている。
引っこ抜いた情報の使い方
とりあえず、どんなネトウヨがどんな気色悪い擁護しているのか眺めてみると良いだろう。「ああ、やっぱりこういう奴はこういう擁護の仕方をするわなぁ」と、俯瞰的に眺めながらニヤニヤすると面白いと思う。
また、どのタイミングでどんな擁護書き込みが増えているかなど、毎日定期的にTwintで書き込みを引っこ抜いてデータベースを作り、時間帯の分析などしてみても良いだろう。
また、ユーザー名を使った検索も可能なので、ネトウヨブロックリストのユーザー名とDappiへの言及を組み合わせて検索し、どんな気持ち悪い書き込み集ができるか作ってみるのも良い。
各々、色々な角度でDappiへの言及を分析すると面白いと思われる。