- 【2025年最新】無料AI音声合成ソフトAivisSpeechとは?使い方から商用利用、自作音源まで徹底解説のPodcast
- はじめに:AivisSpeechが動画クリエイターや開発者に注目される理由
- AivisSpeechとは?VOICEVOXから進化した「感情豊かな声」の正体
- 【初心者向け】AivisSpeechの導入と基本的な使い方 3ステップ
- 音声表現をマスターする:主要パラメータ調整のコツ
- 声の可能性を広げる:AivisHubから音声モデルを追加する方法
- ライバルと徹底比較:VOICEVOXやVOICEPEAKとの違いは?
- AivisSpeechの技術の裏側:Style-Bert-VITS2がもたらす自然さの秘密
- 実践的な活用事例:YouTubeナレーションから業務利用まで
- 【2025年最新動向】Walkers社による事業譲受とAivis Projectの未来
- クリエイター必見!ライセンスと商用利用の注意点
- 【上級者向け】自分だけのオリジナル音声モデルを作成する方法
- まとめ:AivisSpeechは誰におすすめ?
- 参考資料
【2025年最新】無料AI音声合成ソフトAivisSpeechとは?使い方から商用利用、自作音源まで徹底解説のPodcast
下記のPodcastは、Geminiで作成しました。
はじめに:AivisSpeechが動画クリエイターや開発者に注目される理由
2025年、AI技術の進化は留まるところを知りませんが、その中でも特にコンテンツクリエイターや開発者の間で大きな注目を集めているのが、無料のAI音声合成ソフトウェア「AivisSpeech(アイビススピーチ)」です 。その最大の特徴は、まるで人間が感情を込めて話しているかのような、驚くほど自然で表現力豊かな音声を、誰でも簡単に生成できる点にあります 。
AivisSpeechは「感情豊かな音声合成技術を"誰もが"気軽に使える」というミッションを掲げ、個人・法人、商用・非商用を問わず、ソフトウェア本体を完全無料で提供しています 。このオープンな姿勢が、多くのクリエイターの支持を集める大きな理由の一つです。
そして2025年、AivisSpeechは大きな転換点を迎えました。2025年5月、開発プロジェクトである「Aivis Project」が、企業のデジタルトランスフォーメーション(DX)を支援する株式会社Walkersに事業譲受されたのです 。これは単なる運営元の変更ではありません。Walkers社は音声を「最後の未開拓UI(ユーザーインターフェース)」と位置づけ、AivisSpeechの技術を核として「社会・文化・産業の境界を越える"ボイス・インフラ"」を構築するという壮大なビジョンを掲げています 。
この記事では、AivisSpeechがどのようなソフトウェアなのか、その基本的な使い方から、他のソフトとの比較、商用利用の注意点、さらには自分だけのオリジナル音声を作成する方法まで、2025年最新の情報を交えながら、初心者にも分かりやすく徹底的に解説します。
AivisSpeechとは?VOICEVOXから進化した「感情豊かな声」の正体
AivisSpeechの正体を理解する上で欠かせないのが、人気の無料音声合成ソフト「VOICEVOX」との関係です。AivisSpeechは、VOICEVOXの非常に洗練されたエディターUIをベースに開発されています 。ユーザーはVOICEVOXで慣れ親しんだ直感的な操作感のまま、AivisSpeechの機能を利用できます。
しかし、その心臓部である音声合成エンジンは異なります。AivisSpeechは、VOICEVOX ENGINEをベースに独自開発された「AivisSpeech Engine」を搭載しています 。このエンジンこそが、AivisSpeechの最大の特徴である「感情豊かな声」を生み出す秘密です。
その核となる技術が、最新のAIモデルであるStyle-Bert-VITS2です 。この技術により、AivisSpeechはユーザーが複雑な調整を行わなくても、テキストの文脈をAIが理解し、自然な抑揚や感情を自動で付与してくれます 。例えば、喜びの文章は明るい声で、悲しい文章は沈んだ声で、といった表現が手軽に実現できます。これは、手動での細かいイントネーション調整が求められることが多いVOICEVOXと比較して、大きなアドバンテージとなっています 。
開発方針も非常に戦略的です。Aivis Projectは、VOICEVOX本体のUIコードには最小限の変更しか加えず、VOICEVOXの最新アップデートを容易に取り込めるようにしています 。これにより、UIの改善は巨大なVOICEVOXコミュニティの恩恵を受けつつ、Aivis Project自身は音声合成エンジンと、後述する音声モデルの共有プラットフォーム「AivisHub」という、独自の価値提供に開発リソースを集中させることができています。この賢明な戦略が、AivisSpeechの高品質と急速な進化を支えているのです。
【初心者向け】AivisSpeechの導入と基本的な使い方 3ステップ
AivisSpeechは非常に直感的に使えるように設計されており、専門知識がなくてもすぐに高品質な音声を生成できます。ここでは、インストールから音声書き出しまでの3つの基本ステップを紹介します 。
ステップ1:ダウンロードとインストール
まず、公式サイト「Aivis Project」にアクセスし、「AivisSpeechをダウンロード」ボタンをクリックします 。お使いのPC環境に合わせて、Windows版またはmacOS版のインストーラーを選択してダウンロードしてください。


ダウンロードしたファイルを実行してインストールを進めます。macOSの場合、初回起動時に「開発元を確認できないため、使用がブロックされました」という警告が表示されることがあります。その際は、「システム設定」→「プライバシーとセキュリティ」を開き、「このまま開く」をクリックして許可してください 。
初回起動時は、モデルの読み込みなどで数分かかる場合がありますが、これは正常な動作ですので、焦らずに待ちましょう 。


ステップ2:基本的な操作(テキスト入力と生成)
AivisSpeechを起動すると、シンプルな画面が表示されます。
- 画面中央の大きなテキストボックスに、読み上げさせたい文章を入力します 。
-
Enterキーを押すと、入力した文章が下の欄にアクセント句として分割・表示されます 。 - 画面左下のキャラクターアイコンをクリックして、使用したい音声モデル(話者)と、その話者が持つスタイル(例:「ノーマル」「テンション高め」など)を選択します 。
- 再生したい行を選択し、再生ボタン(▶)をクリックすると、合成された音声が流れます 。


ステップ3:音声の書き出し
生成した音声に満足したら、音声ファイルとして保存します。
- 画面右上の「書き出し」ボタンをクリックします 。
-
書き出し方法を選択するダイアログが表示されます。
- 選択音声を書き出し: 現在選択している行の音声のみを個別に保存します。
- 全部書き出し: 入力したすべての行を、それぞれ別の音声ファイルとして保存します。
- 音声をつなげて書き出し: すべての行の音声を一つに連結した、単一の音声ファイルとして保存します。動画のナレーションなどにはこの形式が便利です 。
通常、音声はWAV形式で保存されます 。これで、あなたのプロジェクトで使える音声素材が完成です。
下記は、ダウンロードした音声です。
音声表現をマスターする:主要パラメータ調整のコツ
AivisSpeechの魅力は、デフォルト設定でも自然な音声が生成できることですが、右側のパネルにあるパラメータを調整することで、さらに表現の幅を広げることができます 。
| パラメータ名 | 機能 | デフォルト値 | おすすめの設定・コツ |
| 話速 | 話す速さを調整します。 | 1.00 | 2.0で2倍速、0.5で0.5倍速になります。エネルギッシュな内容は少し速め(1.1~1.2)、重要な説明は少し遅め(0.9程度)にすると効果的です 。 |
| 音高 | 声の高さを調整します。 | 0.00 | ±0.15の範囲で微調整するのが基本です。大きく変更すると音質が劣化する可能性があるため、キャラクターの雰囲気を少し変えたい時に使いましょう 。 |
| スタイルの強さ | 選択したスタイルの特徴(感情など)をどれだけ強く反映させるかを調整します。 | 1.00 | AivisSpeechの鍵となるパラメータ。値を上げすぎると逆に棒読みになることがあるため、0.8~1.2の範囲で少しずつ試すのがおすすめです 。 |
| テンポの緩急 | 話す速さの揺らぎを調整します。 | 1.00 | 値を少し上げると、より人間らしい自然な抑揚が生まれます。単調な読み上げを避けたい場合に有効です 。 |
| 音量 | 出力される音声の音量を調整します。 | 1.00 | 他の音声素材と音量を合わせる際に使用します 。 |
| 開始/終了無音 | 音声の前後に追加する無音の長さを秒単位で設定します。 | 0.10秒 | 動画編集でクリップを配置する際に、セリフ間に適切な「間」を作りたい時に便利です 。 |
さらに、テキストが表示されているエリアで、より高度な編集も可能です。
- アクセントの編集: 各単語の上にあるバーをドラッグすることで、アクセント(音の高低)を直感的に修正できます 。
- フレーズの結合・分割: 不自然な位置で区切られてしまった単語は、その隙間をクリックして結合できます。逆に、ポーズを入れたい場所で単語間をクリックすれば分割できます 。
- 辞書登録: 固有名詞や専門用語など、繰り返し間違って読まれる単語は、「設定」メニューの「読み方&アクセント辞書」に登録することで、正しい発音を記憶させることができます 。
これらの機能を組み合わせることで、プロのナレーターのような、聞き取りやすく表現力豊かな音声を作り出すことが可能です。
声の可能性を広げる:AivisHubから音声モデルを追加する方法
AivisSpeechの真の力は、ソフトウェア単体ではなく、活発なコミュニティによって支えられている点にあります。その中心となるのが、ユーザーが作成した音声モデルを共有・配布するためのプラットフォーム「AivisHub」です 。


AivisHubには、若い女性の声から壮年男性の声、オリジナルキャラクターから実在の人物をモデルにした声まで、多種多様な音声モデルが登録されており、その数は日々増え続けています 。これにより、ユーザーは自分の作品に合った理想の声を、膨大な選択肢の中から見つけ出すことができます。
音声モデルの追加方法は非常に簡単です 。
- AivisSpeechのメニューから「設定」→「音声合成の管理」を選択します 。
- 表示されたウィンドウで「音声合成モデルを探す」ボタンをクリックすると、WebブラウザでAivisHubが開きます 。
- AivisHubのサイトで、好きな音声モデルを探します。各モデルにはスタイル数や「いいね」の数などが表示されており、選ぶ際の参考になります 。
-
気に入ったモデルを見つけたら、ダウンロードします。音声モデルのファイルは、
.aivmxという拡張子です 。 -
再びAivisSpeechの「音声合成の管理」ウィンドウに戻り、「インストール/更新」ボタンをクリックして、先ほどダウンロードした
.aivmxファイルを選択します 。
これでインストールは完了です。キャラクター選択の一覧に新しい音声モデルが追加され、すぐに使えるようになります。この開かれたエコシステムこそが、AivisSpeechを単なるツールではなく、無限に声の可能性が広がるプラットフォームたらしめているのです。


ライバルと徹底比較:VOICEVOXやVOICEPEAKとの違いは?
音声合成ソフトを選ぶ際、他の選択肢との違いは非常に重要です。ここでは、AivisSpeechの主なライバルである「VOICEVOX」と、有料ソフトの代表格「VOICEPEAK」との比較を行います。
| 比較項目 | AivisSpeech | VOICEVOX | VOICEPEAK |
| 価格 | 無料 | 無料 | 有料 |
| 手軽な自然さ | 非常に高い。調整なしでも感情豊かで自然な音声 。 | 標準。調整なしでは機械的になりやすく、自然にするには手動での調整が必要 。 | 非常に高い。有料ソフトならではの高品質な自然さを誇る。 |
| 調整の自由度 | 高い。主要パラメータに加え、アクセント句の編集が可能 。 | 非常に高い。イントネーションを1モーラ単位で細かく調整できるパワーユーザー向け機能が充実 。 | 高い。感情パラメータなどが充実しており、直感的な調整が可能。 |
| 声のバリエーション | 非常に豊富。AivisHubエコシステムにより、ユーザー制作のモデルが日々追加される 。 | 豊富。公式・非公式含め多くのキャラクターが利用可能。 | 豊富。製品ラインナップや追加ボイスが多数用意されている。 |
| 商用利用 | ソフトウェアは無料。音声モデルごとのライセンス確認が必須 。 | ソフトウェアは無料。音声モデルごとのライセンス確認が必須。 | 製品購入により商用利用可能(規約範囲内)。 |
| こんな人におすすめ | 手軽に高品質なナレーションが欲しい初心者、最新のAI技術を無料で試したいクリエイター。 | 細かい部分まで徹底的にこだわりたいパワーユーザー、キャラクター性の強いコンテンツ制作者。 | 予算があり、サポート含め安心して利用したい法人やプロのクリエイター。 |
AivisSpeech vs. VOICEVOX
両者は兄弟のような関係ですが、思想が異なります。AivisSpeechは「AIの力で手軽に自然な声」を目指しており、特に初心者や、調整に時間をかけたくないユーザーにとって最適な選択肢です 。一方、VOICEVOXは「ユーザーの力で理想の声を作り込む」ための強力なツールセットを提供しており、細部までこだわりたい上級者に支持されています 。
AivisSpeech vs. VOICEPEAK
有料ソフトであるVOICEPEAKとの比較では、多くのユーザーが「AivisSpeechの品質は有料ソフトに遜色ない」と評価している点が驚きです 。かつては標準搭載のキャラクター数で差がありましたが、AivisHubの発展により、利用できる声の多様性という点ではAivisSpeechが大きく巻き返しています。最終的には、予算やサポートの必要性に応じて選択することになりますが、AivisSpeechが無料でこの品質を提供していることは、特筆すべき点です。
AivisSpeechの技術の裏側:Style-Bert-VITS2がもたらす自然さの秘密
なぜAivisSpeechはこれほどまでに自然で感情豊かな音声を生成できるのでしょうか。その答えは、音声合成エンジンに採用されているStyle-Bert-VITS2という最先端のAI技術にあります 。この技術は、大きく3つの要素の組み合わせで成り立っています。
- BERT (Bidirectional Encoder Representations from Transformers) BERTは、Googleが開発した言語理解モデルです 。従来のAIが文章を左から右へ一方通行で読んでいたのに対し、BERTは文章全体を一度に読み込み、「左」と「右」の両方の文脈から単語の意味を理解します。AivisSpeechでは、このBERTがテキストの意味や感情(センチメント)を解析する役割を担っています 。これにより、「とても嬉しいです」というテキストをAIが「喜び」の感情だと判断し、自動的に明るい声色で読み上げることが可能になるのです。
- VITS (Variational Inference with adversarial learning for End-to-End Text-to-Speech) VITSは、非常に高品質な音声を生成できる音声合成モデルです 。従来の多くの手法が「テキスト→音声の設計図(メルスペクトログラム)→音声波形」という2段階のプロセスを踏んでいたのに対し、VITSはテキスト情報から直接、最終的な音声波形を生成する「End-to-End」のアプローチを取ります 。この直接的な生成プロセスにより、情報の劣化が少なく、よりクリアで自然な音質が実現されます。
-
Style
Style-Bert-VITS2の「Style」の部分は、音声の「内容(何を話しているか)」と「スタイル(どのように話しているか)」を分離して学習する技術を指します 。スタイルには、感情、声色、リズム、話速などが含まれます。この技術のおかげで、ユーザーは「通常」「怒り」「喜び」といったスタイルをプリセットから選んだり、「スタイルの強さ」パラメータでその度合いを調整したりといった、感情のコントロールが可能になります 。
この「意味を理解するBERT」「高品質な音を作るVITS」「感情を制御するStyle」という三位一体の技術こそが、AivisSpeechの驚異的な自然さを生み出す源泉なのです。
実践的な活用事例:YouTubeナレーションから業務利用まで
AivisSpeechの高品質かつ柔軟な音声は、個人の創作活動からビジネスシーンまで、幅広い分野で活用されています。
コンテンツクリエイター向けの活用例
- YouTube動画のナレーション: 解説動画、商品レビュー、ゲーム実況、Vlogなど、あらゆるジャンルの動画でナレーションを手軽に作成できます。クレジット表記不要(モデルによる)で商用利用も可能なため、収益化を目指すチャンネルでも安心して利用できます 。
- ゆっくりムービーメーカー4(YMM4)との連携: 日本の動画制作者に人気の動画編集ソフト「YMM4」とスムーズに連携できます。設定画面でAivisSpeechを指定するだけで、キャラクターにセリフを喋らせるのが非常に簡単になります 。
- ポッドキャスト・ボイスドラマ: AivisHubで多様なキャラクターボイスを入手できるため、複数の登場人物がいるボイスドラマや、一人語りのポッドキャスト制作にも最適です 。
ビジネス・開発者向けの活用例
- eラーニング教材の作成: 明瞭で自然な発音は、教育コンテンツとの相性が抜群です。実際に、eラーニング制作企業からの需要が非常に高いと報告されています 。
-
AIアシスタント・チャットボットの音声:
AivisSpeech MCP Serverなどのツールを使えば、自社開発のAIアシスタントやアプリケーションに、自然な日本語の音声応答機能を組み込むことができます 。 - コールセンターの自動応答: 従来の機械的な自動音声(IVR)をAivisSpeechの自然な音声に置き換えることで、顧客満足度の向上に貢献します。人手不足の解消やコスト削減にも繋がります 。
- 業務通知の自動化: タスク完了やシステムエラーなどの通知を、音声でリアルタイムに知らせるワークフローを構築できます 。
【2025年最新動向】Walkers社による事業譲受とAivis Projectの未来
2025年、Aivis Projectは株式会社Walkersへの事業譲受という大きな節目を迎えました。これはプロジェクトの停滞ではなく、むしろ未来への大きな飛躍を意味します 。
Walkers社は、AIとノーコード技術で企業のDXを支援する企業です 。同社はAivis Projectの持つ高度な音声合成技術と、自社の持つ事業開発力・マーケティング力を融合させることで、音声をあらゆるサービスに組み込む「ボイス・インフラ」の創出を目指しています 。彼らが語る「テキストで思考を伝え、音声で感情を届ける」という未来像は、AivisSpeechの可能性をさらに広げるものです 。
この事業譲受によるユーザーへの影響と、今後のロードマップは以下の通りです。
-
サービスの継続と発展:
AivisSpeechソフトウェアやAivisHubは、これまで通り無料で利用でき、開発も継続されます。サポート体制はWalkers社に引き継がれ、安定した運営が期待できます 。 - Aivis Cloud API: 現在、ローカルPCでエンジンを動かす必要がありますが、将来的にはクラウド経由で高速に音声合成を利用できる「Aivis Cloud API」のリリースが予定されています。これにより、Webサービスやアプリへの組み込みが格段に容易になります 。
- AivisBuilder: 誰でも手軽に自分だけの音声合成モデルを制作・公開できるツール「AivisBuilder」の開発も進められています。これが実現すれば、声の民主化がさらに加速し、エコシステムはより豊かになるでしょう 。
この動きは、Aivis Projectが持続可能なビジネスモデルを確立しつつあることを示唆しています。無料のオープンソースソフトウェアでコミュニティを拡大し、その技術を基盤とした便利なクラウドサービス(APIなど)を法人向けに提供するという、成功しているオープンソースプロジェクトの王道パターンです。ユーザーは、今後も無料で高品質なツールを使い続けられると同時に、より高度なプロフェッショナル向けサービスの登場にも期待できるのです。
クリエイター必見!ライセンスと商用利用の注意点
AivisSpeechを収益化が絡む活動で利用する際に、最も注意すべき点がライセンスです。ここを誤解すると、思わぬトラブルに繋がる可能性があります。AivisSpeechのライセンスは、二階建て構造になっていると理解してください。
-
ソフトウェアのライセンス:
AivisSpeechおよびAivisSpeech Engineというソフトウェア自体のライセンスはLGPL-3.0です 。これにより、ソフトウェアは目的を問わず(商用利用を含む)、誰でも自由に無料で利用できます 。 - 音声モデルのライセンス: ここが最も重要です。 あなたが利用する「声」そのもの、つまりAivisHubなどからダウンロードした音声モデルには、モデルの制作者が定めた個別のライセンスが適用されます 。
例えば、Aivis Projectが策定した「Aivis Common Model License (ACML)」というライセンスがあります 。これには商用利用を原則禁止する「ACML - Non Commercial」などの種類が存在します 。
では、YouTubeの収益化はどうなるのでしょうか? 多くの音声モデルでは、たとえライセンスが「非商用」であっても、個人のYouTubeチャンネルでの広告収入やスーパーチャットなどは、例外的に許可されているケースが多いです(これを非商用とみなす、あるいは個別に許可するなど)。
しかし、生成した音声を商品として販売したり、企業の広告ナレーションとして使用したりするような、直接的な商用利用は別途ライセンス契約が必要になることがほとんどです 。
法的リスク:著作権とパブリシティ権
AI音声を利用する際には、著作権法やパブリシティ権にも注意が必要です。
- 著作権・著作隣接権: 声そのものに著作権はありませんが、声優がセリフを読み上げるなどの「実演」には著作隣接権が発生します 。
- パブリシティ権: 最も注意すべき権利です。有名人(声優、俳優など)の声にそっくりな音声をAIで生成し、それを商品やサービスの宣伝に利用すると、本人の許可なく顧客誘引力を利用したとして、パブリシティ権の侵害にあたる可能性があります 。これは、たとえAIの学習や生成プロセス自体が合法であっても、利用の仕方によって問題となるケースです。
クリエイターが安全に利用するための鉄則:
- 必ずAivisHubなどで、使用したい音声モデルのライセンスを個別に確認する。
- 商用利用を考えている場合は、「商用利用可」と明記されているモデルを選ぶ。
- 特定の有名人を意図的に模倣したとわかるような音声モデルの商用利用は避ける。
- ライセンスが不明確な場合は、AivisHubに記載されている制作者の連絡先などに問い合わせて許諾を得る。
【上級者向け】自分だけのオリジナル音声モデルを作成する方法
AivisSpeechの究極の楽しみ方は、自分や好きなキャラクターの声を元に、世界に一つだけのオリジナル音声モデルを作成することです。プロセスは専門的ですが、挑戦する価値は十分にあります。
| フェーズ | 主要なタスク | 必要なツール・リソース | 重要なコツ |
| 1. データ準備 | 読み上げる文章(コーパス)の用意 | ITAコーパス: 日本語の音素がバランス良く含まれた、音声合成学習用の標準的なテキスト集 。 | 音素バランスの取れたコーパスを使うことで、あらゆる日本語の発音に対応しやすい高品質なモデルが作れます。 |
| 2. 音声収録 | コーパスの文章を読み上げ、録音する |
・高品質なマイク ・静かな録音環境 ・録音支援ソフト(例: CoReco ) | 一貫性が命。感情を込めず、一定の声質・音量・速度で淡々と読み上げることが重要です。AIが声の「素」を学び、感情は後からエンジンが付与します 。 |
| 3. モデル学習 | 収録した音声とテキストデータをAIに学習させる | Style-Bert-VITS2の学習スクリプト: Google ColabなどのクラウドGPU環境で実行するのが一般的 。 | 音声のスライス、文字起こし、学習の各ステップを実行します。学習には数時間~数十時間かかる場合があり、根気が必要です。 |
| 4. パッケージ化と利用 | 学習済みモデルをAivisSpeechで使える形式に変換する | AIVM-Generator: 学習で生成された複数のファイルを、メタデータ(名前、ライセンス等)と共に.aivmxファイルにまとめるツール 。 | このツールでパッケージ化することで、簡単にインストールしたり、AivisHubで他者に共有したりできるようになります 。 |
このプロセスを経て作成された.aivmxファイルをAivisSpeechにインストールすれば、あなたの声がキャラクターリストに追加され、自由な文章を喋らせることができるようになります。
まとめ:AivisSpeechは誰におすすめ?
AivisSpeechは、2025年現在、AI音声合成の世界に革命をもたらしているソフトウェアです。その特徴をまとめると、以下のようなユーザーに強くおすすめできます。
- 動画制作を始めたばかりの初心者クリエイター: 無料で、かつ驚くほど手軽に、プロ品質のナレーションを手に入れることができます。複雑な調整は不要で、直感的な操作だけで動画のクオリティを格段に向上させられるでしょう。
- より表現力豊かな声を求める中級者・パワーユーザー: VOICEVOXの細かい調整機能に慣れているユーザーも、AivisSpeechの文脈を理解した感情表現には驚くはずです。AivisHubの豊富な音声モデルを使えば、表現の幅は無限に広がります。
- AIアプリケーションを開発するデベロッパー: VOICEVOX互換のローカルAPIは既に強力ですが、今後のCloud APIの登場により、AivisSpeechをサービスに組み込むハードルは劇的に下がります。企業のバックアップを得たことで、将来性も非常に高いです。
- コストを抑えたい法人・教育機関: eラーニング教材や社内向けコンテンツのナレーション作成において、有料ソフトに匹敵する品質を無料で利用できるメリットは計り知れません。ライセンスを正しく理解すれば、強力なツールとなります。
AivisSpeechは、単なるフリーソフトの枠を超え、誰もが「声」という表現手段を自由に扱える未来を切り拓く、壮大なプロジェクトです。Walkers社という強力なパートナーを得て、その進化はこれからさらに加速していくことでしょう。ぜひこの機会に、AivisSpeechの驚くべき実力を体験してみてください。
参考資料
- AivisSpeech MCP Server, https://www.mcpworld.com/en/detail/c23ebb712a0530e3bbc0dee35d6a403a
- AivisSpeech | Smithery, https://smithery.ai/server/@kentaro/aivis-speech-mcp
- GitHub - Aivis-Project/AivisSpeech-Engine: AivisSpeech Engine: AI Voice Imitation System - Text to Speech Engine, https://github.com/Aivis-Project/AivisSpeech-Engine
- GitHub - Aivis-Project/AivisSpeech: AivisSpeech: AI Voice Imitation System - Text to Speech Software, https://github.com/Aivis-Project/AivisSpeech
- AivisSpeech TTS Integration for AI Assistants & Apps, https://mcpmarket.com/zh/server/aivisspeech-1
- 検索結果 - AivisHub, https://hub.aivis-project.com/search?sort=like
- MCP Servers, https://mcpservers.org/
- 無料で商用利用も可能なAI音声合成ソフト「AivisSpeech」は感情表現豊かな音声を簡単に作成可能、その実力とは?, https://gigazine.net/news/20241203-aivis-project-aivisspeech/
- 【初心者向け】AivisSpeechの使い方完全ガイド!, https://note.com/aivis_project/n/nb31893cab32a
- 【2025年最新】AivisSpeech(アイビススピーチ)とは?使い方や料金、商用利用について解説, https://ai-workstyle.com/ai-aivisspeech/
- AivisSpeech(アイビススピーチ)とは?使い方や料金、商用利用の可否を解説, https://ai-bo.jp/aivisspeech/
- 【2025年最新】無料AI音声合成ツール「AivisSpeech」の使い方と活用事例, https://note.com/brightiers/n/n2d7575cf12d3
- 【2025年最新】AivisSpeechとVOICEVOXを徹底比較!ナレーション作成におすすめなのはどっち?, https://busybee.co.jp/p/2025/04/01/3727/
- 【インタビュー】AivisSpeechはなぜ生まれたのか?開発者が語るAI音声合成の未来とクリエイターエコノミーへの貢献, https://wa2.ai/ai-news/avisspeech-interview
- 【無料】商用利用OK!最強のAI音声合成ソフトAivisSpeechがやばい!【VOICEVOX/A.I.VOICE超え?】, https://www.youtube.com/watch?v=SivW4AQTMNg
- AivisSpeechを触ってみた感想, https://note.com/yuki_20020924/n/n59eceaaf6809
- 【AivisSpeech】VOICEVOXとの違いを比較!使い方や設定を解説, https://www.youtube.com/watch?v=M5dxwS0NKik
- 【AivisSpeech】無料で使える音声合成ソフトで遊んでみたら便利すぎた, https://www.youtube.com/watch?v=78x9AX3Hlr4
- Walkers、AI音声合成プロジェクト「Aivis Project」を事業譲受へ, https://audiostart.info/2025/06/02/aivis-project/
- VOICEVOXクローンなOSS、Style-Bert-VITS 2採用の日本語TTSまとめ, https://zenn.dev/geniee/articles/voicevox-sbv2-transcript-synthesizer-20250504
- 本日のAIニュース(2025年7月9日), https://note.com/nekoyashiki96/n/nf90e723ca2bc
- Walkers、JPchainからAI音声合成プロジェクト「Aivis Project」事業を譲受, https://www.marr.jp/mainfo/news/202505
- 【2025】AI音声読み上げツールおすすめ11選!無料・商用利用可・サイト・ソフト・APIも紹介, https://qiita.com/qiita-select/articles/ai-text-to-speech-recommendations
- 【2025年最新】おすすめの人気AIツールはこれ!目的別に50種類を厳選して紹介, https://rinrin-ai.com/blog/ai-tool-2025/
- 【2025年最新】AivisSpeechとVOICEVOXを徹底比較!ナレーション作成におすすめなのはどっち?, https://busybee.co.jp/p/2025/04/01/3727/
- 【AivisSpeech】無料で使える音声合成ソフトが有料並のクオリティだった, https://oiuy.net/archives/35413
- AivisHub - Aivis Project, https://hub.aivis-project.com/
- AI音声合成プロジェクト「Aivis Project」の事業譲受について, https://bestcalendar.jp/articles/press/49415
- 株式会社Walkers、AI音声合成プロジェクト「Aivis Project」を事業譲受, https://prtimes.jp/main/html/rd/p/000000032.000089712.html
- 次世代のユーザーインターフェースとして豊かな音声を - 株式会社Walkers、AI音声合成プロジェクト「Aivis Project」を事業譲受, https://japan.cnet.com/release/31087518/
- 株式会社Walkers、AI音声合成プロジェクト「Aivis Project」を事業譲受, https://news.nicovideo.jp/watch/nw17633157?from=a_newslist_573676
- AI音声合成プロジェクト「Aivis Project」の事業譲渡に関するお知らせ, https://jpchain.co.jp/news/2025-05-08-aivisproject-transfer/
- Style-Bert-VITS2を動かしてみる, https://zenn.dev/asap/articles/f8c0621cdd74cc
- Style-Bert-VITS2のパラメータについて, https://note.com/sirodon_256/n/n40b2b1bd5aca
- 【Style-Bert-VITS2】使い方や特徴・商用利用について, https://kurokumasoft.com/2024/02/14/style-bert-vits2/
- 【Style-Bert-VITS2】自分の声をAI化して好きなセリフを喋らせてみた, https://www.youtube.com/watch?v=zRirNw_AKIM
- 【日本語でも自然な音声合成AI】Style-Bert-VITS2のデモを試してみた, https://weel.co.jp/media/tech/style-bert-vits2-jp-extra/
- Style-Bert-VITS2における事前学習モデルの作成方法, https://ayousanz.hatenadiary.jp/entry/2024/02/24/043619
- Bert-VITS2の仕組み(論文ナナメ読み), https://zenn.dev/litagin/articles/8c6edcf6b6fcd6
- Bert-VITS2の調査メモ(1), https://www.matrixflow.net/blog/2024/12/26/bert-vits2%E3%81%AE%E8%AA%BF%E6%9F%BB%E3%83%A1%E3%83%A2%EF%BC%881%EF%BC%89/
- 【Style-Bert-VITS2】自分の声をAI化して好きなセリフを喋らせてみた, https://note.com/yuki_tech/n/nca6ecb57469a
- Bringing VMagicMirror to Life: Real-time Emotional Expression with Python and Style-Bert-VITS2, https://qiita.com/Maki-HamarukiLab/items/f7d013cd3001f1d2d6b8
- Bringing VMagicMirror to Life: Real-time Emotional Expression with Python and Style-Bert-VITS2, https://hamaruki.com/bringing-vmagicmirror-to-life-python-and-style-bert-vits2-real-time-emotional-expression/
- 【Style-Bert-VITS2】AI音声合成で感情表現を豊かにしてみた!, https://www.youtube.com/watch?v=jhy4zdgcMsg
- Bert-VITS2でずんだもんを感情豊かにしてみる実験, https://zenn.dev/litagin/articles/37c5ed78bd7935
- 【Style-Bert-VITS2】AI音声合成で感情豊かな声を作る方法【Vtuber】, https://www.youtube.com/watch?v=3asYHqmmkf0
- Style-BERT-VITS2を試してみた, https://note.com/kazuya_bros/n/nfbd17f55dc66
- GitHub - Aivis-Project/AivisSpeech: AivisSpeech: AI Voice Imitation System - Text to Speech Software, https://github.com/Aivis-Project/AivisSpeech
- GitHub - Aivis-Project/AivisSpeech-Engine, https://github.com/Aivis-Project/AivisSpeech-Engine
- Google Colaboratory, https://note.com/ai_meg/n/n8b3e534f1ff4
- AivisSpeechを使ったDiscordボットの作成 ②Google Cloud上のTTSサーバーを叩くDiscordボットを, https://qiita.com/__dAi00/items/e10e656c3009abb7887e
- AivisSpeechを使ったDiscordボットの作成 ③ストリーム処理による応答高速化, https://qiita.com/__dAi00/items/970f0fe66286510537dd
- AivisSpeech TTS Integration for AI Assistants & Apps, https://mcpmarket.com/zh/server/aivisspeech-1
- AivisSpeech MCP server, https://playbooks.com/mcp/kentaro-aivis-speech
- AivisSpeech-Engine を使って音声合成してみた, https://zenn.dev/sharl/articles/2a86f940308299
- Aivis Project, https://aivis-project.com/
- AivisSpeech - ゆっくりMovieMaker4, https://manjubox.net/ymm4/faq/%E3%82%86%E3%81%A3%E3%81%8F%E3%82%8A%E3%83%9C%E3%82%A4%E3%82%B9/AivisSpeech/
- 【YMM4】ずんだもんの立ち絵を無料でダウンロード!導入方法を解説, https://oiuy.net/archives/16111
- 【2024年最新】AI音声合成の著作権と法律リスクを弁護士が解説, https://www.soft-voicesynthesis.com/knowledge/copyright.html
- 音声生成AIと著作権の関係は?弁護士が3つのルールを解説, https://itbengo-pro.com/columns/368/
- 【2024年6月施行】改正著作権法と生成AIのビジネス利用の関係を弁護士が解説, https://storialaw.jp/blog/11379
- 生成AIとゲーム開発と著作権, https://takamichi-lab.github.io/assets/pdf/slide/2023/takamichi23cedec_copyright.pdf
- 歌手・声優の「声」と生成AI(1)~現行法での法的権利と開発・学習段階での論点~, https://storialaw.jp/blog/11344
- 生成AIで生成したイラストや声は著作権侵害になる?, https://note.com/aicu/n/nd9df7d8da5da
- GitHub - Aivis-Project/ACML: ACML: 音声合成モデルのための、シンプルで実用的なライセンス, https://github.com/Aivis-Project/ACML
- 合成音声モデル「しのも(CV:紫野まお)」「あお(CV:藍沢えま)」, https://aioilight.space/shinomao/
- 【Aivis Common Model License 1.0】立ち絵・アイコン素材(ベース), https://www.simulationroom999.com/blog/anneli-standing-picture-icon-base-2/
- AI 技術の進展に伴う声や肖像の保護に関する法的課題, https://www.inpit.go.jp/content/100884322.pdf
- ディープフェイクから著名人の「声」と「肖像」を守る米国の取組, https://www.cpra.jp/cpra_article/article/000762.html
- AI時代の知的財産権検討会 中間とりまとめ, https://www.meti.go.jp/policy/economy/chizai/chiteki/pdf/shozo_koe.pdf
- 著名人の氏名・肖像を守る「パブリシティ権」とは?, https://atlawyer.jp/column/AqXHmvfZ
- AI音声合成と著作権の関係は?開発・学習段階と生成・利用段階に分けて弁護士が解説, https://monolith.law/corporate/ai-voice-copyright-1
- ディープフェイク対策のために政策立案者ができること, https://jp.newsroom.ibm.com/2024-03-05-Blog-Heres-What-Policymakers-Can-Do-About-Deepfakes
- ディープフェイクとは?対策5選・見分け方・悪用事例を解説, https://liskul.com/deepfake-167329
- ディープフェイク詐欺からビジネスを守るための完全ガイド, https://note.com/jolly_yucca1286/n/n91d6cc69aba4
- AI Engine API User Guide, https://download.amd.com/docnav/aiengine/xilinx2023_2/aiengine_api/aie_api/doc/index.html
- AivisSpeech MCP Server, https://www.mcpworld.com/en/detail/c23ebb712a0530e3bbc0dee35d6a403a
- AivisSpeechをAPI経由で実行して音声合成するサンプル, https://qiita.com/yoshiweb/items/c34ddb25ee5c33f11ac7
- AivisSpeech, https://mcpmarket.com/server/aivisspeech
- aivis Engine v2 - Signal Monitor Inference Worker - Web-API (2.4.0) | API Reference, https://aivis-engine-v2.docs.vernaio.com/reference/2.4.0/docker/sm-inference-worker-web/
- GitHub - Aivis-Project/AivisSpeech-Engine, https://github.com/Aivis-Project/AivisSpeech-Engine
- Speech-to-Text-to-Speech with AI using Python: A How-To Guide, https://medium.com/data-science/speech-to-text-to-speech-with-ai-using-python-a-how-to-guide-ee9b0b0ef082
- Looking for Python code examples for Fast Transcription API, https://learn.microsoft.com/en-us/answers/questions/2077998/looking-for-python-code-examples-for-fast-transcri
- GitHub - shinshin86/mcp-simple-aivisspeech, https://github.com/shinshin86/mcp-simple-aivisspeech
- AivisSpeech MCP Server, https://mcp.aibase.com/en/server/1916341271511408642
- Aivis-Project (Aivis Project), https://github.com/Aivis-Project
- MCP Simple AivisSpeech, https://www.mcpworld.com/en/detail/6023664f6fe10351b7fdab5fd6fa7a92
- API Documentation, https://swagger.io/solutions/api-documentation/
- How to generate offline Swagger API docs?, https://stackoverflow.com/questions/34984820/how-to-generate-offline-swagger-api-docs
- voicevox.py-client, https://voicevox-client.tuna2134.jp/
- Generating REST API docs by Swagger, https://elixirforum.com/t/generating-rest-api-docs-by-swagger/57862
- VOICEVOX ENGINE, https://voicevox.github.io/voicevox_engine/api/
- VOICEVOX(音声合成)をREST-APIで利用する, https://qiita.com/A_T_B/items/1531d78944d8b796b9fa
- 【Style-Bert-VITS2】自分の声をAI化して好きなセリフを喋らせてみた, https://note.com/aituberonair/n/n8209691bc94a
- VITSについて, https://qiita.com/zassou65535/items/00d7d5562711b89689a8
- Style-Bert-VITS2で音声モデルを作成してみた, https://qiita.com/t-hashiguchi/items/c27ac4e8cc7b5b5f5f48
- 機械学習に欠かせないデータセットとは?作り方やおすすめサイトを紹介, https://exawizards.com/column/article/ai/machine-leaning-data-set/
- 生成AIに最適なデータセットとは?作り方や入手方法、注意点を解説, https://weel.co.jp/media/gen-ai-dataset
- 機械学習に欠かせない学習データとは?活用事例やデータセットの作り方を解説, https://aismiley.co.jp/ai_news/ai-learning-data-utilization-guide/
- AI音声認識の仕組みとは?ディープラーニングや特徴量、学習データを解説, https://robot-fun.com/column/8750
- 音声AIのためのデータセット設計入門, https://zenn.dev/fairydevices/articles/3c624c03695a32
- AI学習データの作成方法とは?データセットの作り方や注意点を解説, https://www.tryeting.jp/column/2663/
- 15m先の声も拾う8個のマイク。AIボイスレコーダー「M5」は録音も文字起こしも全部おまかせ, https://www.gizmodo.jp/2025/07/machi-ya-aivoicerecorderm5-end-848129.html
- 15m先の声も拾う8個のマイク。AIボイスレコーダー「M5」は録音も文字起こしも全部おまかせ, https://www.lifehacker.jp/article/machi-ya-aivoicerecorderm5-start-848129/
- 15m先の声も拾う8個のマイク。AIボイスレコーダー「M5」は録音も文字起こしも全部おまかせ, https://www.roomie.jp/2025/06/1515827/
- 【2025年最新版】ナレーション収録におすすめなマイク5選!, https://www.shimamura.co.jp/shop/nagoya/product/20250402/11584
- AI議事録作成ツールとは?メリットや選び方、おすすめ6選を比較, https://www.abkss.jp/blog/169
- 【2025年】AIボイスレコーダーのおすすめ10選 議事録作成を効率化, https://sakidori.co/article/2848825
- GitHub - mmorise/ita-corpus: ITAコーパスの文章リスト, https://github.com/mmorise/ita-corpus
- ITAコーパス読み上げ音声【あみたろの声素材工房】, https://amitaro.net/voice/corpus-list/ita/
- ITAコーパスの収録方法とコツ, https://tsumuntema.com/ita-corpus-recording/
- GitHub - TylorShine/coreco-recorder, https://github.com/TylorShine/coreco-recorder
- ITAコーパス読み上げ音声の試聴ページを公開しました, https://amitaro.net/wp/20230614_01/
- ITAコーパス読み上げ音声の配布状況, https://tyc.rei-yumesaki.net/material/corpus/ita-list/
- 音声合成の依頼の仕方、中身の人の探し方, https://note.com/itamana/n/nd483c32af311
- MYCOEIROINK作成方法, https://hasewoalice.wixsite.com/griffins-nest/mycoe
- ゲームキャラクターの音声合成 ~コーパス作成から音声合成モデル実装まで~, https://cedec.cesa.or.jp/2022/session/detail/7.html
- Style-Bert-VITS2とAivisSpeechを使って自分の声でAI合成音声を作ってみたんだ, https://note.com/1namine/n/n25ef5dda972f
- 【Style-Bert-VITS2】自分の声をAI化してAivisHubに公開してみた, https://note.com/yuki_tech/n/n5bdbbc95b61b
- Conditional Variational Autoencoder with Adversarial Learning for End-to-End Text-to-Speech, https://www.researchgate.net/publication/352373615_Conditional_Variational_Autoencoder_with_Adversarial_Learning_for_End-to-End_Text-to-Speech
- Conditional Variational Autoencoder with Adversarial Learning for End-to-End Text-to-Speech, https://hackmd.io/@machineS/SkaO6tohi
- Conditional Variational Autoencoder with Adversarial Learning for End-to-End Text-to-Speech (ICML 2021), https://hackmd.io/@machineS/ryxgf9s2i/%2FWPhSgdvKS8ucpOWX-RNuzg
- Supplementary Material of Conditional Variational Autoencoder with Adversarial Learning for End-to-End Text-to-Speech, http://proceedings.mlr.press/v139/kim21f/kim21f-supp.pdf
- NIX-TTS: An Incredibly Lightweight End-to-End Text-to-Speech Model via Knowledge Distillation, https://arxiv.org/pdf/2203.15643
- Conditional Variational Autoencoder with Adversarial Learning for End-to-End Text-to-Speech, https://arxiv.org/pdf/2106.06103
- BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding, https://www.researchgate.net/publication/328230984_BERT_Pre-training_of_Deep_Bidirectional_Transformers_for_Language_Understanding
- BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding, https://aclanthology.org/N19-1423/
- BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding, https://huggingface.co/papers/1810.04805
- BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding, https://ar5iv.labs.arxiv.org/html/1810.04805
- BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding, https://www.reddit.com/r/MachineLearning/comments/9nfqxz/r_bert_pretraining_of_deep_bidirectional/
- BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding, https://scispace.com/papers/bert-pre-training-of-deep-bidirectional-transformers-for-3mez6kncl2
- StyleTTS 2: Towards Human-Level Text-to-Speech through Style Diffusion and Adversarial Training with Large Speech Language Models, https://papers.neurips.cc/paper_files/paper/2023/file/3eaad2a0b62b5ed7a2e66c2188bb1449-Paper-Conference.pdf
- RikkaBotan/style_bert_vits2_english_original, https://dataloop.ai/library/model/rikkabotan_style_bert_vits2_english_original/
- litagin/Style-Bert-VITS2-1.0-base, https://huggingface.co/litagin/Style-Bert-VITS2-1.0-base
- Benchmarking Expressive Japanese Character Text-to-Speech with VITS and Style-BERT-VITS2, https://arxiv.org/abs/2505.17320
- GitHub - daniilrobnikov/vits2: VITS2: Improving Quality and Efficiency of Single-Stage Text-to-Speech, https://github.com/daniilrobnikov/vits2
- Models - Hugging Face, https://huggingface.co/models?p=1&sort=modified&search=bert+vits
- Aivis Project, https://aivis-project.com/
- GitHub - Aivis-Project/AivisSpeech, https://github.com/Aivis-Project/AivisSpeech
- AivisSpeech-Engine/README.md at master · Aivis-Project/AivisSpeech-Engine, https://github.com/Aivis-Project/AivisSpeech-Engine/blob/master/README.md
- AivisHub, https://hub.aivis-project.com/
- 【インタビュー】AivisSpeechはなぜ生まれたのか?開発者が語るAI音声合成の未来とクリエイターエコノミーへの貢献, https://wa2.ai/ai-news/avisspeech-interview
- ヒホ(ヒロシバ)のメモ帳, https://blog.hiroshiba.jp/
- オープンソースソフトウェアの導入事例, https://openstandia.jp/case_study/
- How to Monetize Your Content as a Creator, https://web.tapereal.com/blog/how-to-monetize-your-content-as-creator/
- The Creator Economy, Grown Up: What We Saw at VidCon 2025, https://news.patreon.com/articles/the-creator-economy-grown-up-what-we-saw-at-vid-con-2025
- Understanding the creator economy: A roadmap, https://ifttt.com/explore/understanding-creator-economy-a-roadmap
- Creator Economy – Everything You Need To Know, https://www.nfi.edu/creator-economy/
- The Creator Economy on Patreon: A Platform-Scale Data Analysis, https://www.cs.toronto.edu/~ashton/pubs/patreon-creator-economy-icwsm2022.pdf
- A Complete Guide to Understanding the Creator Economy, https://fourthwall.com/blog/complete-guide-to-understanding-creator-economy
- 【A.I.VOICE】YouTubeの収益化は可能?ライセンスを確認, https://minbdevice.com/aivoice-license/




コメント