あなたのPC作業、AIがもっと楽しくする!カラクリの国産CUAモデル「KARAKURI VL2」で新しい働き方を見つけよう!
「毎日パソコンとにらめっこ、もっと効率よく作業できたらなぁ…」そう思ったことはありませんか?実は、そんなあなたの願いを叶えてくれるかもしれない、画期的なAIが登場しました!カラクリ株式会社が開発した、国産CUA(Computer Use Agent)向け視覚言語モデル「KARAKURI VL2」です。
「KARAKURI VL2」ってどんなAI?
「KARAKURI VL2」は、まるであなたの隣にいる優秀な秘書さんのように、PCの操作を自律的にこなしてくれるAIエージェントなんです。特に注目なのは、8B(80億)という軽量なパラメータ数。これは、企業のローカル環境でも動かせるように設計されている証拠。つまり、機密性の高いデータを外部に出すことなく、あなたのPCで安全にAIを活用できる可能性があるということですね。
驚きの成果!画像編集もメールもAIにおまかせ
この「KARAKURI VL2」は、カラクリが自社開発した日本語PC操作ベンチマーク「OSWorld-JP v0.2」で評価されました。その結果、特に画像編集ソフト「GIMP」とメールソフト「Thunderbird」の操作において、海外の主要モデルである「Claude Sonnet 4.6」を上回るスコアを記録したんです!
想像してみてください。例えば、画像編集で「この部分を切り取って、サイズを調整して」とAIに指示するだけで、サッと作業が終わってしまう未来。また、メールの振り分けや定型文の作成も、AIがサポートしてくれるかもしれません。さらに、複数のアプリケーションを横断して操作する能力も、ベースモデルと比較してなんと約2.8倍も向上したそうですよ!これは、普段のPC作業がぐっとスムーズになる可能性を秘めていますね。
なぜこんなに頼りになるの?「KARAKURI VL2」の秘密
「KARAKURI VL2」が特定の業務領域でこれほど高い精度を発揮できるのには、いくつかの秘密があります。
まず、一つは「合成データによる業務特化学習」。これは、インターネット上にはない、実際の業務で使われるような操作パターンをAIに学習させているということ。だからこそ、コンタクトセンターなどで日常的に行われる画像編集やメール操作といった、具体的な業務で力を発揮できるんですね。
そして、カラクリのCPO(最高プロダクト責任者)である中山智文さんは、日本のAI開発の方向性について、こんな素敵なビジョンを語っています。
「日本の産業を支えてきた『現場の磨き上げ(現場力)』をAIの知性に変えること」
これは、海外の汎用モデルと競うのではなく、日本の現場が培ってきた知恵や工夫をAIに取り入れることで、私たちにとって本当に役立つAIを創り出そうという思いが込められています。

中山さんは、特に「業界特化」「独自データ」「自前運用」の3つの領域に注力したと話しています。特定の業務に特化することで、軽量モデルでも十分な精度が出せることを確認できたそうですよ。きっと、あなたの仕事も効率アップするでしょう。
みんなで育てるAI!オープンソースで公開中
もっと嬉しいお知らせがあります!なんと、「KARAKURI VL2」の学習済みモデルと、評価に使われた日本語PC操作ベンチマーク「OSWorld-JP」が、オープンソースで公開されているんです。
「私もAI開発にチャレンジしてみたい!」「どんな風に動くのか、自分の目で確かめてみたい!」そう思っている方にとって、これは絶好のチャンスですよね。
-
学習済みモデル(KARAKURI VL2):https://huggingface.co/karakuri-ai/karakuri-vl-2-8b-thinking-2603
-
ベンチマーク(OSWorld-JP v0.2):https://github.com/karakuri-ai/OSWorld-JP
これらの公開を通じて、国内のCUA研究コミュニティ全体で、AIの知見を深めていこうという、とても前向きな取り組みなんです。
未来の働き方、AIと一緒に描こう
カラクリ株式会社は、この「KARAKURI VL2」を基盤として、AIエージェントアプリケーションのサービス化を進めていく予定だそうです。カスタマーサポートから始まり、将来的には様々なアプリケーションをまたぐ操作の自動化へと対象を広げていくとのこと。
AIは、私たちの仕事を奪うものではなく、もっとクリエイティブで、もっと人間にしかできないことに集中するための「最高のパートナー」になってくれるはずです。
この「KARAKURI VL2」の登場は、私たち一人ひとりがAIとどう向き合い、どう活用していくかを考える、素晴らしいきっかけになるでしょう。ぜひ、公開されているモデルやベンチマークに触れて、AIが拓く新しい可能性を体験してみてくださいね!





