RTX Pro 4500 BlackwellでQwen 3.6 27Bをローカル実行
NVIDIAのプロフェッショナル向けGPU「RTX Pro 4500 Blackwell」で、Qwen 3.6 27Bをローカル実行したベンチマーク結果がRedditのr/LocalLLaMAコミュニティで共有された。
RTX Pro 4500 Blackwellは48GBのメモリを搭載し、Compute Capability 12.0を備える。ユーザーはCUDA 13.1環境下で、量子化モデルQwen3.6-27B UD-Q5_K_XLをllama.cppで動かし、以下のパフォーマンスを確認している。
- プロンプト処理(pp512): 1751.21 t/s
- テキスト生成(tg128): 35.83 t/s
コンテキストサイズは131,072トークン(131K)に設定され、Flash Attentionも有効化されている。ユーザーはこのモデルをRoo Codeに接続し、Unreal Engine 5の開発に活用しているという。
先日RTX 5000 PROでのQwen3.6-27B稼働報告があったばかりだが、Blackwell世代のPro系GPUでも48GBクラスのVRAMがあれば、27Bパラメータモデルの高速ローカル実行が現実的になりつつある。特にプロンプト処理で1,700 t/sを超える速度は、コーディングアシスタント用途で実用的なレベルと言える。
トランザクショングラフ100万枚からDeFi攻撃を検出するVision-Language Model
ブロックチェーンの取引データを画像化し、Vision-Language Model(VLM)で攻撃パターンを検出する試みが注目を集めている。
「Sigui」と呼ばれるDePINセキュリティオラクルプロジェクトでは、Ethereum、Arbitrum、Polygonの3チェーンから187万件の実際のオンチェーントランザクションを収集し、100万枚のトランザクショングラフ画像を生成した。各グラフにはDRAIN_STAR、MIXING_CHAIN、NORMALの3種類のアノテーションが付与されている。
データセット生成にはAMD MI300X上で20コアの並列処理を用い、約1時間15分で完了した。現在はQwen2-VL-7BをLoRAでファインチューニングし、静的ルールに頼らずに取引グラフから攻撃パターンを視覚的に検出できるモデルの開発を進めている。
データセットはMITライセンスでHuggingFaceに公開済み。併せてAIエージェントの身元と脅威を管理するEthereum標準規格ERC-8259の提案も行われている。
従来のルールベース検出の限界を補うアプローチとして、グラフ構造そのものを「画像」としてVLMに入力するという発想が興味深い。DeFiセキュリティだけでなく、ネットワーク異常検出など他分野への応用も期待される。
日本のエンジニアコミュニティから
QiitaではAI活用に関する実践的な記事が目立った。
Claude Codeの効果的な使い方として「要件を1つの指示にまとめる」手法が紹介された。断片的なチャット指示よりも、全要件を統合したプロンプトの方が精度が向上するという体験談は、自律型AIエージェント全般の使い方として参考になる。
また、フリーランスエンジニアがClaudeと組み合わせてObsidianを「第二の脳」として構築した3日間の記録や、個人の暗黙知を組織の知識ベースに自動変換するOSSマルチエージェント基盤「Praxia」(Apache 2.0)の発表もあった。エンジニアリング現場でのAI統合が具体的なツールとして形になりつつある。