エンジニアのつぶやき

  1. HOME
  2. エンジニアのつぶやき

お客さまのビジネスに役に立つ技術トレンドやトピックスをお届けします

2024/06/18

 ”OSSを使ってみた シリーズ”

Whisperを使ったリアルタイム文字起こし 前編

こんにちは。テクノロジーデザイン本部 技術部 開発課です。
ChatGPTをかわきりにさまざまなLLM(Large Language Model)がでてきて、最近ではMeta社のLlama3の発表などもありLLMやVLM(Vision and Language Model)などの生成AIに興味をもった方もおられるかと思います。

その状況下で、生成AIへの入力を音声から行う試みとしてJETSON OLIN AGXを使ってリアルタイムで文字起こしをご紹介したく、記事に纏めたいと思います。