AIクローラーを制御する「RSL Collective」はどこまで実効力を持つか?マスメディアや大手出版社も乗るべきか?

2025年12月9日、note株式会社が「RSL Collectiveの日本初の公式プラットフォームパートナーになる」と発表しました

RSL Collectiveってのは、ざっくり言うと「コンテンツをAIにどう使われるか制御する」ための仕組みなんだけど、「対象コンテンツをAIは学習していいか・推論利用の可否・有料ならいくら」みたいな条件を機械可読にする規格みたいなものです。
こいつが標準になる可能性があるんですよね。可能性の話なんでまだわからんけど、LLMs.txtよりはこいつの方が優勢な感じ。

まだ本当に標準化されるかわかりませんが、インターネットビジネスだとか日本のパブリッシャー(=各メディア、出版社・版元)やコンテンツに関わる人は注視しておいた方がいい動きだと思ったので、ぼくの調べられる範囲のことを書いておきます。
(ぼくはテックジャーナリストじゃないんで、ミスや間違いがあるかも。そういうときは叩かずに優しく教えてくださいね)

ちょっと長いんですが、がんばって書いたので最後まで読んで欲しいw

 

「RSL Collective」とか「RSL Standard」ってなに?

RSL Collectiveは、その条件を束ねてAI企業と一括交渉・ライセンス・徴収する非営利団体。音楽業界のJASRACとかASCAPみたいなポジションをやろうとしているって考えると分かりやすいかな?

仕組みはこんな感じ。

  • パブリッシャーやプラットフォームがRSL Collectiveに参加する
  • RSL CollectiveがAI企業との料金表や契約条件をまとめて交渉する
  • AI企業(OpenAIとかGoogleとか)は、RSL Collectiveと契約すれば、多数のサイトのコンテンツを「まとめて」ライセンス契約したことにして利用できる。
  • 集めたお金を、各パブリッシャーに分配する

すでに参加しているパブリッシャー・プラットフォームは、Reddit、Yahoo、Medium、Quora、USA Today、BuzzFeed、Internet Brands、O'Reilly など。
これにnoteが加わったってことになる。

まだ大手新聞やテレビ局は米国でも様子見っぽい。

 

RSL Standard

RSL Collectiveが使う技術規格が、RSL Standard(Really Simple Licensing Standard)。

パブリッシャーが「自分のコンテンツをAIにどう使ってよいか」を、機械可読なライセンスとして表現する規格です。

robots.txtに /license.xml の場所を追記した上で、license.xmlに以下のような情報を記載して使います。

  • どのコンテンツに対して
  • どんな用途で(トレーニング、検索、要約など)
  • 使って良いかどうか & 無償か、有償か
  • 有償ならいくらか(または課金モデルの情報を書く)

例を出すと、「AIトレーニング利用は禁止」とか「トレーニングは有料。要約・回答での利用は無料でも許可」みたいに用途別に細かく条件を変えられる感じ。

 

どうせ robots.txt に従う一部のクローラーだけ対応して、海賊的なAI企業は無視するんでしょ?

ここまで読んで、「どうせrobots.txtにちゃんと従う一部のクローラーうだけの話で、海賊的なAI企業は無視するんでしょ?」って思いましたよね?
ぼくも最初はそう思いました。

ここで出てくる重要なプレーヤーが、CDN企業のFastlyとCloudflare。

FastlyとCloudflareは、RSL Standardへの協調に前向きです。
つまり、RSL Standardに指示した内容を守らないAIクローラーをCDNレイヤーでブロックする、強制力になるかもしれないってことです。そうなればRobots.txtに従うお行儀の良いクローラー以外にも強制的に効果を発揮できるってことです。
(もちろん、これはFastlyやCloudflareが把握している既知のクローラーに対してしか効果はありませんが、全世界的に影響があるのは間違いないと思います)

前々からCloudflareは「クローラをブロックする機能」を提供していて、さらに今年は「Pay Per Crawl」を2025年7月にβリリースしました(まだベータ版だけど)。これは、名前の通り「〇〇ドル払ったらクロールしていいよ」ってレスポンスを返して、AIクローラー側が「その金額を払います」って応答をしたときだけ通す仕組みなんですが、これをRSL Standardで指定した通りにクローラーに条件提示できるようにしていくってことのようです。

Fastlyは、すでにlicense.xmlに対応済みだそうです。
(RSL Collectiveが一般的に利用されるようになってRSLライセンスサーバーが動くようにならないと、支払い・徴収が難しいような気はするむ)

ともかく、こんな感じの分担になって強制力を発揮できるようになるかもしれない、という話なのであります。

  • RSL Collective:ライセンス条件と料金を規定し、音楽のJASRACみたいに取りまとめて徴収を行う権利管理団体。
  • Cloudflare / Fastly:RSLの条件に従わないクローラをWAF/CDNレイヤーで止めちゃう計画。

という感じで、それぞれが補完し合う構造になっているんですよね。

 

とはいえ、現時点でどのくらい意味あるの?

ここが一番気になるところだと思うので、現実的な話をしていきますが……現時点だと実効力は、ほぼないです。

LLMs.txtに従うAI企業がないので実装しても無意味なのと同様に RSL Standard も書いたとだけでは対応してくれるAI企業はありません。

OpenAI・Google・xAI・AnthropicMeta・Meta・PerplexityといったAI企業は「メディアからコメントを求められても無視(拒否)している」とも報道されていて、RSL Standardに従った例も観察されていないし、RSL経由でライセンス料を支払った例もない。

WAF/CDNレイヤーでクローラーを止められることに困ってきたら動くかもしれないので、GoogleとかOpenAIが「金を払って他社より便利なAIにする」って意思決定をしたら流れが変わるかもしれません。

まあ、いまのところは「パブリッシャー側の交渉カード」としての意味合いが強くて、RSLに準拠せずにクロールし続けたら法的リスク・レピュテーションリスクが徐々に高まっているって感じ。
とりあえず、AI企業へのプレッシャーにはなっていると思う。

Cloudflare / Fastly 以外のCDNやクラウドサービスもRSLにのっかってきたら、さすがにAI企業も金を払わざるを得ないかもしれないもんね。

 

Googleとかいうやつが特権的な立場なんよ。

ここで無視できないのが、Googleの特異性。

Googleについては「検索エンジンのクローラ」と「AI学習用クローラ」の区別が曖昧で、同じUser-Agentを使用するなどしているため、Cloudflare側で一律ブロックするのが難しいという課題があります。

CloudflareのCEOも「検索から消えてしまうかもしれないから、サイト運営者がGoogleだけクローラーをブロックをしにくい」と指摘しているんですよね。
これは、RSL + CDNレイヤーでのブロックでも解決が難しい。

AI企業の中でも、Googleだけは「検索」という既存インフラを持っているがゆえに、特権的な立場にいるわけですね。
Googleはわざとそれやってると思うんで、ちょっとズルいんですよね〜

 

ところで、noteはなにするんよ?

noteの公式リリースを読むと、こんな感じのことが書いてある。

  • noteプラットフォームとしてRSL対応を進める
  • 記事単位でRSLライセンスを埋め込めるようにする
  • 将来的には、RSL Collective経由のライセンス収益をnoteクリエイターへ分配することも視野
  • noteが日本国内の出版社・メディア・クリエイター関連団体がRSLを簡単に導入できるようにしていく。(日本の窓口になるってことなのか?
  • noteは、RSLフレームワークを日本の環境に適合させるため、技術面と実務面の両方から検証を進め、国内の権利者が容易に導入できる仕組みづくりを進めます。

つまり、noteは日本でRSLを広める役割になりましたって発表だったってことだね。

個人的には、これまでのnote社はこういう技術的な対応があまり上手くなかった印象だから、日本の出版社とかクリエイター関連団体に対して自分たちをよく見せようとしてるんじゃないの〜という懐疑心もちょっと湧いてしまいますが、この取り組みは上手くやるかもしれませんから悪口は言わずに様子を見たいと思います。

 

LLMs.txt や他団体のAI制御規格はどうなる?

llms.txtは、RSL Standardに似てるんだけどllms.txtに「AIに読んでほしいコンテンツを指定する規格」のことです。

とはいえ、llms.txtは、RSL CollectiveやIETFのような公的標準化団体によるものではなく、Jeremy Howardさん個人の提案をコミュニティで検討している感じなんですよね。

胡散臭いSEO屋さんがよく「LLMs.txtを置かないとAI検索に出ないですよ」って裏付けもない情報を出してるから騙されてる人も多いけど、GoogleのJohn Muellerが「現状、llms.txtを実際に利用しているAIシステムはない」「将来の標準になることにも懐疑的」って言ってるし、マトモなSEO関係者からは「やるだけ労力のムダ」って言われてるんですよね。
Jeremy Howardさんが提案した内容自体は悪くないんだけどね。
かわいそうw

RSLの方は仕組みとしても運営団体としても、llms.txtより現実寄りだと思うんですよね。
(前述の通り、RSL Standardもいますぐ実装したとてAIクローラー側が無視してくるので意味ないんですけど、金を払わないとクロールさせないCDNとの組み合わせによって強制力が働く可能性はそれなりにあるかなと)

あと、RSL Standardの強いところは、RFCの仕様策定に関わるIETFのワーキンググループプがやってるAI Preferencesとも協調してるところ。

IETF AI Preferences はお金の話や徴収・配分は範囲外で、AIに対して情報をどう扱っていいかを指定する標準になる可能性があって、RSL Standardはライセンス条件、課金モデル、Collective経由の徴収・分配まで拡張したあたりを担当することを狙ってるみたいなんだよね。

 

なんにしてもAI企業が従わないと意味がない & 今のところはマスメディアや大手出版社は様子見してるんだが…

新聞社・テレビ局・大手マスメディアあたりからすると、まだできたばかりのRSL Collectiveを信用して任せていいか分からんといったところだと思う。
RSL Collectiveがちゃんと動きだせば、訴訟まわりもやってくれるわけだから、信用できるとなれば新聞社・テレビ局・大手マスメディアも乗っかりやすい仕組みになってるんじゃないかな。
(日本だとJASRACみたいな感じって言うとわかるでしょ?)

 

noteみたいなユーザー投稿プラットフォームとしては「AI向けのデータサプライヤー兼代理店」というユーザーデータをAI企業に販売できる新しいポジションを取りに行ける可能性があるから乗っかりやすいんだろうね。
note以外のプラットフォームも、クリエイターがAI利用の可否や金額を設定できるようになると面白いかもしれないね。

なんにしてもAI企業が従わないと意味がないのだが、RFCになったり、実質的にアクセスできない情報が増えてくると動きも変わるかもしれないな〜と思ったりします。

 

ここらへんの情報は気になるところだから、これからも追っていこうと思います〜
それにしても、ずいぶん長いブログを書いてしまった。