MIT発の組込みベクトルDB「Caliby」がオープンソース化

MITデータベースグループのXinjing Zhou氏(Michael Stonebraker教授指導)とSea-Land AIのJinming Hu氏が共同開発した組込みベクトルデータベースCalibyがオープンソースで公開された。MITライセンスで提供され、pip install calibyで利用可能。

特徴

  • HNSW / DiskANN / IVF+PQの3種類のインデックスをサポートし、百万〜数千万規模のベクトルに対応
  • テキストとベクトルの統合管理:エンベディングと生テキストを同一システムで保持し、ベクトルDBとリレーショナルDBを行き来する必要を排除
  • ディスク永続化:FAISSの「メモリに収まらないと使えない」という弱点を克服。プロセス再起動後もインデックスが自動復元される
  • SIMD加速(AVX-512 / AVX2 / SSE)によるCPU最適化。GPU不要

性能比較

pgvector(PostgreSQL拡張)と比較して、ビルド速度約2倍、クエリQPS約4.5倍を達成。PostgreSQLインスタンスの運用も不要で、DuckDBのようにプロセス内で完結する設計が特徴。FAISSに対しては、メモリ超過時の「動作不能」という問題をディスクスピルで解決している。

AIエージェントへのアプローチ

Calibyは「汎用ベクトルDB」ではなく、AIエージェント/RAG用途に特化したデータ管理エンジンを目指している。LangChainやCrewAIなどで発生するセッション間メモリの永続化、メタデータフィルタリング、マルチインデックス分離などを単一ライブラリで実現する。

"AI agent and RAG scenarios need a lightweight, embedded data engine like DuckDB."

開発チームは「AI AgentデータのDuckDB」というビジョンを掲げており、将来的にはGPU加速やTypeScriptバインディングも予定している。


AWS MCP Serverが正式リリース(GA)

2026年5月6日、AWS MCP ServerがGenerally Available(GA)となった。これにより、Claude CodeやCursorなどのAIコーディングアシスタントから、15,000以上のAWS操作を直接実行可能になった。

何が変わるか

従来、AWSリソースの操作にはAWSコンソールの操作かCLIの実行が必要だった。MCP(Model Context Protocol)Server経由でAIアシスタントがAWS APIを直接呼び出せるようになり、インフラ構成の確認、リソースの作成・変更、コスト確認などを自然言語で指示できる。

Qiitaの解説記事では「AWSコンソールを開くのが面倒くさい」という課題が、このリリースで根本的に解決されたと評価している。


ACMが「vibe coding」に警鐘

ACM(Association for Computing Machinery)のTechnology Policy Councilが、AIを使ったコーディング手法「vibe coding」に対して強い懸念を示す報告書を発表した。

報告の要点

  • AIコーディングプラットフォームは設計・テスト・レビューなどの基本的なソフトウェアエンジニアリング実践をスキップさせやすい構造的問題がある
  • 「AIは理解していない」とし、生成されたコードの正確性を人間が検証する仕組みの重要性を強調
  • vibe coding(プロンプトで指示してAIに書かせる手法)の蔓延が、ソフトウェア品質の低下につながるリスクを指摘

この報告は、同日にHacker Newsでも「I Will Never Use AI to Code」という意見記事が30ポイントを獲得しており、AIコーディングの是非に関する議論がコミュニティでも活発になっていることを示唆している。


その他の動き

  • Qwenの無料利用に制限:RedditのLocalLLaMAコミュニティで、Qwenモデルの無料利用に何らかの制限がかかったとの報告が上がっている。詳細は現時点で不明だが、オープンソースLLMの利用環境に変化の兆しがある
  • llama.cppのMTP対応:Multi-Token Prediction(MTP)のllama.cpp公式サポートを待つ声がコミュニティで上がっており、ローカルLLMの高速化ニーズが高まっている

出典