Twitter(X) コミュニティノートについて知って欲しいことを暑苦しく語る

誤解を招きそうなツイートに対してTwitter(X)ユーザーが背景情報を書くことができるコミュニティノート機能が日本でも正式リリースになりましたね。

このTwitterコミュニティノート機能、フェイクニュースや陰謀論などを見た人が冷静に判断しやすくなる背景情報を付与でき、とても意義深いです。

しかし、この機能自体に対する誤解も多い上に、僕が見て残念な使い方も増えてきているように思います。

そこで、この記事では Twitterコミュニティノートについて解説しながら、いかにこれが超絶スゴい複雑さで「インターネットっぽい仕組みか」を語っていきたいと思います。

Twitterが好きな人も嫌いな人も、どうか最後まで読んでもらえれば嬉しいです。

 

コミュニティノートは書いただけでは表示されない、複雑な仕組みだよ。

コミュニティノートは、誤解を招きそうなツイートに対してTwitterユーザーが背景情報を書くことができる機能です。

(個人的には、この見出しだけで誤解が大きく広まることもなさそうなのでコミュニティノートをつけるほどではないと思うのですが、ノートが表示された例示)

このコミュニティノート。ノートを書いただけで表示されるわけではなく、他の複数名のコミュニティノートユーザーから評価をされる必要があります。

「役に立った」と「役に立たなかった」という評価をされ、役に立った評価スコアが高くなることで一般のTwitterユーザーに表示されるようになります。

そして、一度表示された後からでも「役に立たなかった」評価がされると表示が消えることがあります。

評価の仕組みは複雑で、多くのノートは書かれただけで一般ユーザーには表示されていません。ほとんどは評価が集まらないか、スコアが足りないままになり、一般ユーザーが見ているのは書かれたうち「表示されるためのスコアが溜まった」のごく一部ということになります。

感情的な同調や多数派を煽るようなノートが強くなり過ぎないよう、多数決ではなく複雑な評価アルゴリズムが用意されていて、これが正しい方法とまではいかないものの、2020年代だからこその新しい方法が使われているんですよね。詳細は後述します。

 

誰が背景情報を書いたか、どのノートに誰がどんな評価をしたか、データ公開されている。

見出しの通り、コミュニティノートではどのツイートに対して誰がどんな背景情報を書いたか、どのノートに誰がどんな評価をしたか、透明性の高いデータ公開がされています。

Twitterアカウントさえあれば誰でもデータをダウンロードできますので、データ分析が得意な方は、ぜひ触ってみて欲しいです。

膨大な量のデータがあって、どのノートにどんな評価がついたかの評価データだけで1GB(660万行)くらいあります。

※各ファイルやカラムの説明はこちらに書いてあります。

表形式でデータ例を表示
こんな感じで、どのノートにどんな評価がついたか、すべてデータが公開されているので、偏ったノートを書いてるユーザーや、評価が偏っているユーザーを探したり、傾向を分析することも可能です

例えば、ちょっと話題になったあるコミュニティノートがあるのですが、このノートはどんな評価がされたのか調べてみると「役に立った」と「役に立たなかった」など様々な150件程度の評価がついていることがわかります。

このノートに限らず、どのコミュニティノートユーザーが書いて、どのユーザーが間違った背景情報を役に立つと評価してしまったのか、すべて調べることも可能です。

敵対陣営のツイートだけに躍起になって反論ノートをつけて回ったり、それを同じような仲間グループで評価してる情報操作も発見可能、というわけです。

(ただし、コミュニティノートユーザーIDとTwitter本体のIDは紐づいていないので、誰が書いたか分かるといっても、コミュニティノート内のIDまでしか分からないようになっています。ここがなぜそういう仕組みなのかは後述します)

 

多数派の意見だけにならないよう、多様な評価によって役に立つノートが選ばれる。

更に、多様な評価を必要とする仕組みがとても面白いです。

このコミュニティノートに公式ドキュメントの一節を読むだけでも、かなり問題点を理解した上で、様々な配慮をしていることが分かるかと思います。

皆様もご存知のとおり、コミュニティノートのような一般参加型のオープンなシステムの構築には、多くの課題が存在しており、たとえば情報操作の影響を受けにくくしたり、社会の多数派に属する協力者や、何らかの偏見を持つ協力者が全体の大半を占めないように、協力者の属性を分散させたりといった対応が取られています

(コミュニティーノートガイド課題より引用)

どういう風にこれを解決しているかというと、これがその一例。

同質の多数派だけが強くならない考え方。ノート①への評価が分かれた二人が、ノート②では一致した。このように別々の考え方を持つ多様な人たちが評価した方が高いスコアになる。

ノート①への評価が分かれた二人が、ノート②では一致した。
このように別々の考え方を持つ多様な人たちが評価した方が高いスコアになる。

あくまで概念を分かりやすくするために僕がつくった図なので、詳細は是非とも「共謀による情報操作行為の防止」や「多様な意見の反映と、偏見形成の防止」などのドキュメントも読んでみてください。

あ、このブログを読み切ってから後でね(最後まで読んで欲しいので)。

communitynotes.twitter.com

※このアルゴリズムのソースコードも公開されています。

また、ノートを書いた人も「役に立たなかった」がつくと、書いたノートが「役に立った」場合の5倍のマイナス評価がつきます(マイナスの評価がつくことで表示されにくくなったり、コミュニティノートで活動できなくなることもあります)。

つまり、役に立たないノートを書くイタズラ的なユーザーはすぐに退場になるだけでなく、賛否両論あるノートばかり書いているようなユーザーもマイナス評価されて行動が制限やすいので、コミュニティが荒れにくくするようになっているのですね(理論上は、ですが)

 

問題点も沢山あるけれど、バランスをとろうとしている。

もちろん、問題がいくつもあります。

そのうちのひとつが、刺激的で誤解を生む情報やフェイクニュースが物凄い勢いで広まっているときでも「評価が溜まるまで表示されにくい」という点。

ぼく自身も、フェイクニュース的なツイートにノートを書いたものの、なかなか一般ユーザーに表示されないのをヤキモキしながら見ていることがあります。

しかし、前述のように大衆ウケするだけの刺激的な意見やイタズラなどがすぐ一般ユーザーに表示されるようでは困りますし、表示するノートを厳選するために評価に時間をかける力を強めれば強めるほど、誤解を生む情報を止めにくくもなるというバランスの難しい仕組みになっています。

さらに、現状のコミュニティノートのユーザー数が数万人程度と少ないため、まだまだ多様な評価が集まりにくい。

そのため、現実的には、多様な評価になるまで表示しないという訳にはいかずに、(多数決ではないが、理想よりは多数決に近い形で)とりあえずノートが表示されているという問題もあります。

理想は多様×多数だが、現状は「ちょっと多様」×「少数」からの評価になりやすい

これにより、「なんなとく正しいっぽい」といった印象だけで評価された意見までがノートとして表示されてしまうということが発生しています。

体感として8割くらいのノートは、恐らく問題なく本当に「役に立って」いるのだと思いますが、不要なノートが表示されたり、(これは本当に極少数ですし、後から消せるのですが)ノートの方が間違っていたということも起こっています。

これらの問題点は、ちゃんと課題として公式ドキュメントにも書かれているので、問題を把握して何とかしようとしています。

 

できることがある、僕もあなたも。

今回、コミュニティノートという、Twitterを起点としたインターネットの情報流通を良くすることのできるとても強力な仕組みが提供されました。これだけで全てが良くなることはありませんし、問題もあります。

でも、問題だけに注目しすぎず、多くの人たちが関われば関わるほど良い状態になるという「インターネットらしい仕組み」であり、僕やあなたが協力すれば、嘘の情報や詐欺に騙されるなどの事故や事件を減らすことができる可能性があることにも注目してみてください。

はじまったばかりの新しい取り組みをダメだダメだと腐したり、Twitterはこうすればいいんだと評論家のようなことを言うのではなく、僕やあなたのできる範囲でインターネットの健全さに協力する選択をしてもらえたら嬉しいなと思います。

 

■ コミュニティノートの「役に立たなかった」や「役に立たなかった理由」をつけることの意味も知って欲しい。

すぐにできることのひとつとして、「役に立たなかった評価をする」というものがあります。

コミュニティノートは論敵に反論したり、バカを晒し上げる場ではありません。
「意見を潰す目的」のノートが増えると、フェイクニュースや詐欺対策などのコミュニティノートの威力が下がってしまうと僕は考えます。

もし、ノートがついているツイートを見かけたときに、そのノートが正しい情報を提示してたとしても、元ツイートをしている人が気に入らないとしても、ノートが「意見への反論」として書かれているのであれば、「このツイートには不要なノートである」という評価をつけることを検討してみてください。

「このツイートには不要なノートである」というコミュニティノートの評価画面キャプチャ

コミュニティノートの評価画面キャプチャ

「正しい情報がつくなら良いのでは?」と思うかもしれませんが、ノートが必要になるのは元ツイートによって誤解が生じるときであって、晒し上げるときや反論するときではないのです。

ノートが書かれてしまうことは止められませんが、バカを晒そうとするノートや、ツイートで反論すればいいことをノートを匿名リプライのように使うことを止めることはできます。

正しいっぽい情報で相手を叩くためのラベルをつけるのは(そのノートに書かれたことが正しいとしても)、ただの扇動です。間違っていたら叩いて良いといわけではありませんし、少なくともコミュニティノートはその道具ではありません。リプライでやってくれ。

元ツイートがフェイクニュースだとか詐欺商材を売っているといった誤解を招くものであればコミュニティノートをつける意味がありますが、単に間違ったことや自分と違う意見を言ってるだけならば「本当にこのツイートを見た人は誤解をするのか?ノートが必要なツイートか?」を考えて評価してみてもらえばと思います。

僕も含め、多くの人は間違ったことを言い(ツイートし)ます。そして、間違ったことが言えなくなることや、それを恐れて口を閉ざすようになるインターネットは決して健全とは思えません。

ノートの内容が正しい場合、どうしても人は(表示する必要がなくても)「役に立った」と評価をしたくなるものですが、フェイクニュースや社会的に影響のある誤解が生じるツイートにこそコミュニティノートが必要なのであって、間違ったことを言っている人をバカにして溜飲を下げるためのノートであれば(ノートの内容が正しくとも)本当に一般Twitterユーザーに表示すべきか考えてから評価されたるべきだと思います。

この記事を読んだあなたが、より良い評価者としてコミュニティノートに参加してもらえたら、僕はとても嬉しいです。

 

仕組みを理解する。

コミュニティノートは前述の通り、透明性があり、誰が書いたか、誰が評価したか分かるようになっています。

しかし、それはあくまでもコミュニティノート内のIDとコードネームであり、どのTwitterユーザーであるかは秘匿されています。それによって「匿名で好き勝手なことを無責任に書けるコミュニティノートは信頼できない」という誤解をされることがあります。

なぜ、どのTwitterユーザーであるかを隠しているかは、「○○さんが書いたなら高評価しよう」とか「反対意見の陣営のやつが書いたノートは全て低評価する」といった政治的な行動をとることを防止して、ノートの中身だけで判断するためです。

ノートを書く人にとっても通常のTwitterアカウントと紐づかないことで、同調圧力や報復を恐れずに自身の陣営を批判したりできるようになることが調査によって明らかになっているそうです。

よくよく考えて見てください。
仕事や料理のツイートをしている人が「あの政治家にノートをつけた」と思われるならばノートを書いたり評価したりすることはできなくなり、コミュニティノートは強い政治性のある人たちや行動がTwitterアカウントと紐づいても困らない人たちだけのものになってしまいます。
それでは多様なコミュニティにはならないのです。

また、この記事で何度か説明している通り、低評価がついたノートを書いた人は激しめにマイナス評価されるので、コミュニティノート内での活動はすべて透明性があります。

偏ったノートを大量に書いたり、偏った評価をしているコミュニティノートユーザーを特定することも可能です。そのユーザーの書いたノートをすべて低評価することすらできます。

コミュニティノートの公式ドキュメントには「自身の投稿への評価について結果責任を負い」と書かれています。場合によっては活動が停止されますから「匿名で好き勝手なことを無責任に書ける」のではありません。

「匿名で好き勝手なことを無責任に書けるコミュニティノートは信頼できない」というツイートを見かけても反論ノートをつける必要はありませんが(笑)、あなたも含め多くの人がこの仕組みを理解するだけでも、コミュニティの健全性の維持に寄与することができると僕は考えます。

※「匿名で好き勝手なことを無責任に書けるコミュニティノートは信頼できない」というツイートにいちいち反論ノートをつけているコミュニティノーターもいますが、それこそ自分のアカウントを使ってリプライでやってくれよな

 

この壮大な実験に、未来を感じる。

エンジニアの @nishio さんがコミュニティノートについてこう書かれています。
(僕はまったく面識ありませんが引用させていただきます)

  • 主観的データを「客観的ではないからゴミだ」と捨てるのではなく、たくさん集めることによってそこから意味を引き出す
  • かつては「合計、平均、多数決」みたいに、しょぼい特徴量しか使ってなかったので主観データをたくさん集めても有用でなかった
    • コンピュータの性能の向上と行列分解の研究の発展で、高次元の行列から意味を見出すことがやりやすくなったわけだ

scrapbox.io

「合計、平均、多数決」みたいに、しょぼい特徴量しか扱えなかった人類に、アルゴリズムで新しい可能性が提示されていて、それを実験してるところに立ち会ってると考えると、ちょっとコミュニティノートの見え方も変わってきませんか?

絶対に成功する凄い仕組み、、、とは言いません。この実験も失敗に終わるかもしれませんし。

でも、「どうせダメだよ」と冷笑的な態度をとらずに、バカみたいに前向きに未来が良くなると信じる人が増えれば増えるほど、この仕組みは上手く回るんだと思うんですよね。

ぼくはTwitterに限らず、インターネットが大好きです。
情報流通の仕組みによって様々な考え方や知らなかったこと、楽しいことに出会える。

しかし、情報流通が多くなるということは素晴らしい情報以上にノイズも増えることを意味していて、それは構造上どうしても発生することです。

そんなデジタル社会に対して「人間は愚か」とか「Twitterはゴミ」とか文句を言うのは簡単ですけど、ぼくはインターネットという情報流通の仕組みによって様々な考え方や知らなかったことに出会えて幸せに生きているので、少しでもその良い部分を増やしたいと思っています。

そんなに完璧でなくても良いと思うんですよね、誤解を招くツイートの5%でも10%でも「質の良いコミュニティノート」が書かれれば、それだけで沢山の人が助かるわけですから。