DeepSeekの思考を操る!ロールプレイ特化プロンプト術

最近のAIモデルが「考えている」数秒間、画面に流れていく思考プロセスのテキストを眺めるのが密かな楽しみになっている。人間のように迷い、自己訂正し、時には堂々巡りをする。推論モデルの台頭によって、私たちはLLMの「脳内」を … 続きを読む

AIに規則を強制する新フレームワーク「Harmonist」

AIに規則を強制する新フレームワーク「Harmonist」 プロンプトの末尾に「THIS IS IMPORTANT!(これは重要!)」と大文字で書き足す不毛な作業に、私たちはいつまで時間を費やすのだろうか。 AIコーディ … 続きを読む

Tencent発!295Bの推論特化MoEモデル「Hy3」

Tencent発!295Bの推論特化MoEモデル「Hy3」 最近、インフラエンジニアの同僚たちと話すと、決まって「LLMの推論コストをどう叩くか」という泥臭い話題に行き着く。いくらベンチマークで人間超えを達成しようが、G … 続きを読む

LLMエージェントの評価・監視OSS「Future AGI」

「動く」と「使える」の間に横たわる深い溝 「動くプロトタイプなら、週末のハッカソンで作れる。でも、それを本番環境で安定稼働させるには、数ヶ月の血の滲むようなデバッグが必要になる」 最近、スタートアップのCTOや大企業のA … 続きを読む

GASでDPIを回避?次世代プロキシツールの仕組み

かつて、インターネットは国境を溶かす魔法の空間だと信じられていました。しかしテック業界で15年も飯を食っていると、その理想が徐々に崩れ、物理的な国境と同じかそれ以上に強固な「デジタルな壁」が世界中に築かれていくのを嫌でも … 続きを読む

DeepSeek発!LLM用GPUカーネルライブラリ

演算の限界を叩き出す「言語」の正体 最近、メガテック企業のカンファレンスや論文を眺めていると、奇妙な既視感を覚えることがある。かつてWebブラウザのレンダリング速度をミリ秒単位で削り合っていた時代のように、今は誰もが「G … 続きを読む

LLMと因果推論でROI予測するAIツール「oransim」

LLMと因果推論でROI予測するAIツール「oransim」 企業のマーケティング予算を決定する会議室で、私は幾度となく同じ光景を目にしてきた。数千万、時には億を超えるキャンペーン予算の承認を求める現場に対し、経営陣は決 … 続きを読む

AIエージェントを自動最適化!Meta-Harness入門

AIエージェントを自動最適化!Meta-Harness入門 私がソフトウェアエンジニアとしてキャリアをスタートさせた15年前、システムの振る舞いはすべて決定論的なコードで記述されていた。それが今や、LLMという非決定論的 … 続きを読む

XからAIトレンドを自動収集!週報生成パイプライン

XからAIトレンドを自動収集!週報生成パイプライン 数年前まで、私たちの朝のルーティンはシンプルだった。コーヒーを淹れ、TwitterのタイムラインやRSSを流し見すれば、業界の熱気や最先端のツールが自然と目に飛び込んで … 続きを読む

LangGraph製自律型脆弱性スキャナ「Clearwing」

セキュリティ診断の現場は、長らく「職人芸」の領域だった。ポートスキャンに始まり、微細なバナー情報から稼働サービスを推測し、既知の脆弱性を洗い出す。そこから先、システムにどう侵入し、どこまで権限昇格できるかは、ペンテスター … 続きを読む