AIがデジタル詐欺を加速させる実態をBloombergが報道、LLM推論が並列検証で4.5倍に、llama.cppがデュアルBlackwellでNCCLフリー化

AIがデジタル詐欺を「より簡単に、より速く、より止めにくく」している

Bloombergが発表した調査レポートは、AI技術の悪用がオンライン詐欺の landscape を根本から変えつつあることを詳らかにしている。ディープフェイク音声による電話詐欺、AI生成文面を使ったフィッシング、本人確認プロセスの突破――これらはすべて、生成AIの普及によって手軽かつ大規模に実行可能になったという。

従来の詐欺対策が前提としていた「人間が手作業で偽造する」モデルはもはや通用しない。AIはプロンプト一つで信頼性の高い偽コンテンツを量産でき、しかも言語の壁を越えて多国籍に展開できる。報告では、特に金融機関やEコマースプラットフォームが新たなリスクに直面していると指摘している。

この問題は技術的な対策だけでなく、規制と教育の両面からアプローチが必要だと強調されている。

LLM推論スループットが並列検証で4.5倍に

Prescienteのレポートによると、LLM推論のスループットが並列検証（Parallel Verification）という手法によって4.5倍に向上したという。この手法は、複数の推論パスを同時に実行し、結果を並列で検証することで、従来の逐次処理のボトルネックを解消する。

推論速度はLLMの実用性を直接左右する要素であり、特にエージェント用途やリアルタイム応答が求められるシナリオでは大きな意味を持つ。4.5倍という数字が再現性のあるものであれば、LLMのデプロイコストを劇的に引き下げる可能性がある。

Akamaiが大型LLM契約で急伸、Cloudflareは陰り

The Registerの報道によると、Akamaiが大型のLLM関連契約を獲得し、株価が急伸した。一方で、同じCDN/エッジコンピューティング市場のCloudflareは減速が伝えられている。

LLMの推論インフラ需要は、これまで主にハイパースケーラー（AWS、GCP、Azure）に集中してきたが、エッジ側でのLLM配信や推論需要が高まる中、CDN事業者の戦略的な位置づけが変わりつつある。Akamaiがこの市場で先行できた背景には、長年培ってきたエッジコンピューティングのノウハウと、エンタープライズ向けセールスの強みがあるとみられる。

Cloudflareにとっては、Workers AIなど独自のAI推論プラットフォームを持つにもかかわらず、LLMの大口契約で後れを取った形だ。市場の競争構造が予想以上に流動的であることを示している。

llama.cppがデュアルBlackwell PCIeでNCCL不要のテンソル並列を実現

RedditのLocalLLaMAコミュニティで注目を集めているのは、llama.cppのビルドb9095でNCCLフリーのテンソル並列（Tensor Parallelism）がデュアルBlackwell PCIe環境で動作するようになったという報告だ。

従来、複数GPUでのテンソル並列にはNVIDIAのNCCLライブラリがほぼ必須だったが、新しい実装ではこれが不要になった。消費者向けBlackwell GPU（RTX 5060 Tiなど）を2枚挿しした環境でも、シンプルな設定でテンソル並列が使えるようになるという。

ローカルLLMコミュニティにとって、高価なデータセンター向けGPUに頼らずにコンシューマーGPUの複数枚構成で大規模モデルを動かせることは大きな意味がある。特に、RTX 5060 Ti 2枚という構成はコストパフォーマンスに優れており、個人開発者や小規模チームの選択肢を広げるものだ。

RAGでsemantic chunkingが期待外れ ― 論文ベースの検証結果が話題に

Zennで公開された記事がRAGコミュニティで注目を集めている。Vectara社が発表した論文を調査した結果、多くのケースで「semantic chunking」が期待よりも低い精度にとどまることが分かったという。

RAGのチャンク戦略は、実務では「何となく512トークンで切っている」か「semantic chunkingにすれば精度が上がるはず」という思い込みで決められがちだ。しかし論文の結論は、この直感を覆すものだった。

記事では、なぜsemantic chunkingが負けるのかのメカニズムと、Markdownコンテンツに対する実践的な推奨戦略を整理している。RAGシステムを設計・運用するエンジニアにとって、固定的な前提を見直すきっかけになる内容だ。

AIエージェントに「パスポート」 ― オープンアイデンティティ標準の提案

GitHubで「AI Agent Passport」というプロジェクトが公開された。AIエージェントのためのオープンなアイデンティティ標準を定めようという試みだ。

AIエージェントが増え続ける中、誰がどのエージェントを運用しているのか、エージェントの権限と信用はどう管理するのか、という問題が顕在化し始めている。Agent Passportは、エージェントの身元証明と権限スコープを標準化することで、エージェント間の協調や人間とのやり取りにおける信頼の基盤を提供することを目指す。

まだ初期段階のプロジェクトだが、AIエージェントのエコシステムが成熟する上で避けて通れない課題に取り組むものとして、今後の展開が注目される。