Claude Code用TDDツール「EvanFlow」
「AIがコードを書く時代、プログラマーの仕事はコードレビューだけになる」。ここ数年で耳にタコができるほど聞いたセリフだが、実際にフルオートのコーディングエージェントを実際のプロダクト開発に放り込んでみると、そんな甘い夢は … 続きを読む
「AIがコードを書く時代、プログラマーの仕事はコードレビューだけになる」。ここ数年で耳にタコができるほど聞いたセリフだが、実際にフルオートのコーディングエージェントを実際のプロダクト開発に放り込んでみると、そんな甘い夢は … 続きを読む
現実世界の公差はLLMの夢を見るか AIが書いたコードをそのまま本番環境にデプロイすることへの心理的ハードルは、ここ1〜2年で劇的に下がった。では、AIが設計したジョイント部品をそのままCNCフライスや3Dプリンターに放 … 続きを読む
AIに規則を強制する新フレームワーク「Harmonist」 プロンプトの末尾に「THIS IS IMPORTANT!(これは重要!)」と大文字で書き足す不毛な作業に、私たちはいつまで時間を費やすのだろうか。 AIコーディ … 続きを読む
Tencent発!295Bの推論特化MoEモデル「Hy3」 最近、インフラエンジニアの同僚たちと話すと、決まって「LLMの推論コストをどう叩くか」という泥臭い話題に行き着く。いくらベンチマークで人間超えを達成しようが、G … 続きを読む
「動く」と「使える」の間に横たわる深い溝 「動くプロトタイプなら、週末のハッカソンで作れる。でも、それを本番環境で安定稼働させるには、数ヶ月の血の滲むようなデバッグが必要になる」 最近、スタートアップのCTOや大企業のA … 続きを読む
AIでWebゲームを全自動生成する「OpenGame」とは ここ最近、CursorなどのAIコーディングツールを使っていて、ある種の「もどかしさ」を感じることはないだろうか。単一の関数やアルゴリズム、独立したコンポーネン … 続きを読む
書籍をAIエージェントの実行可能スキルに変換するツール 本棚に並ぶ背表紙を眺めるたびに、軽い徒労感を覚えることはないだろうか。私たちは日々、先人たちの知恵が詰まった名著を読み漁る。しかし、いざ複雑なシステム設計のトレード … 続きを読む
AIエージェントを自動最適化!Meta-Harness入門 私がソフトウェアエンジニアとしてキャリアをスタートさせた15年前、システムの振る舞いはすべて決定論的なコードで記述されていた。それが今や、LLMという非決定論的 … 続きを読む
「Webの自動操作」というテーマは、エンジニアにとって常に悩みの種だった。かつてPhantomJSがもてはやされ、やがてHeadless Chromeが標準となった時、私たちは「ついに完璧な解決策を手に入れた」と安堵した … 続きを読む
セキュリティ診断の現場は、長らく「職人芸」の領域だった。ポートスキャンに始まり、微細なバナー情報から稼働サービスを推測し、既知の脆弱性を洗い出す。そこから先、システムにどう侵入し、どこまで権限昇格できるかは、ペンテスター … 続きを読む