About

テキスト入力の新しいかたち

koedeskは単なる文字起こしツールではありません。人間がコンピュータにコンテキストを伝える方法そのものを変える、パラダイムシフトです。

キーボードは始まりであって、終わりではない

近代以降、キーボードは人間がコンピュータとコミュニケーションするための主要な手段でした。コマンドを打ち、コードを書き、メッセージを作成する。しかしAIが単なるツールではなく協働者となった今、伝えるべきコンテキストの量は爆発的に増えています。キーボードだけでは、もう足りません。

音声認識技術はいま、転換点を迎えています。話すことが、目新しさではなく、タイピングに代わる本格的な入力手段になりました。これは人間とコンピュータの関わり方における、パラダイムシフトです。

QWERTYキーボードでタイピングを覚えたときと同じように、音声入力にも練習が必要です。しかし、その習得にかかる時間はキーボードよりはるかに短く、得られる生産性の向上ははるかに大きい。私たちは単にツールを提供するのではなく、入力そのものに対する考え方を変える、新しい体験を届けたいと考えています。

英語だけでなく、すべての言語のために

音声入力ツールの多くは米国で開発され、英語に最適化されています。英語話者には十分に機能しますが、それ以外の言語では品質が著しく低下します。日本語に英語の技術用語が混じったり、ベトナム語にコードが混在したりすると、既存のツールはしばしば完全に破綻します。

koedeskの開発者は日本人で、ベトナムから開発しています。複数の言語やアクセントを跨いで音声入力を使うこの日々の実体験が、あらゆる設計上の判断に反映されています。他の人が見落としていたことに気づきました。英語とそれ以外の言語の間にある精度の格差です。

だからこそ、デフォルトモデルとしてElevenLabs Scribe v2を推奨しています。英語や日本語だけでなく、ベトナム語、インドネシア語、スペイン語をはじめとする多くの言語で、一貫して高い精度を発揮します。Scribe v2をデスクトップアプリで利用できるのは、現時点ではkoedeskだけです。

シンプルであること

koedeskは意図的にシンプルに設計されています。キーを押して、話して、離す。テキストはカーソルの位置に表示されます。余計な手順も、使い始めるための設定も不要です。

内部では、パフォーマンスに徹底的にこだわっています。アプリはブラウザエンジンやOSと同じ言語であるRustで構築されています。音声区間検出、音声キャプチャ、文字起こしの開始まで、すべてが最小レイテンシに最適化されています。話し終わった瞬間に、テキストが表示されます。

多くの競合ツールは、音声認識モデルで文字起こしした後に、軽量なLLMでフィラーの除去や文法修正、書き言葉への変換を行う二段階パイプラインを採用しています。私たちのアプローチは異なります。Scribe v2は十分に高精度であり、LLMによる後処理は不要です。モデルの出力をそのまま信頼しています。

これは意図的な選択です。音声認識モデルが進化し続ける中、LLM後処理の必要性は消えていくでしょう。アーキテクチャをシンプルに保つことで、koedeskは基盤モデルのあらゆる改善を、間に複雑なレイヤーを挟むことなく、直接享受できるようにしています。

Guide Inc.について

Guide Inc.は、東京に本社を置き、ベトナム・ホーチミン市に開発拠点を持つソフトウェア開発会社です。2021年の設立以来、日本の大手金融機関向けの取引プラットフォームやモバイルアプリの開発を専門としてきました。

koedeskは、私たちの日々の業務の中から生まれました。複雑な金融システムを開発するエンジニアとして、AIコーディングアシスタントとのやり取り、ドキュメントの作成、メッセージの入力を、キーボードの流れを止めることなく、もっと速くする方法が必要でした。自分たちが欲しかったツールを作り、世界に届けることにしました。

Guide Inc.について詳しく →

koedeskをお試しいただき、ありがとうございます。

Masaki Kondo

CEO, Guide Inc. Vietnam

koedesk リードデベロッパー

お問い合わせ

お問い合わせ: info@koedesk.app