操作手順を説明する文章を一から書くのは、思った以上に時間がかかります。「どの画面でどこをクリックするか」を言葉で正確に伝えるのは難しく、気づけば作成に数時間かかっていた経験がある方も多いのではないでしょうか。
Google Geminiなどの生成AIを使えば、操作を録画した動画をアップロードしてプロンプトを入力するだけで、テキスト形式のマニュアルを自動生成できます。
この記事では「動画をAIに読み込ませてテキスト形式の手順書を生成する方法」を中心に、撮影やプロンプトの工夫、注意点、ツールの使い分けまでをカバーしています。AI搭載の動画マニュアル編集ツール(tebiki・TeachMe Biz等)についても後半で選択肢として紹介しています
私たちNotePMは、AIで生成したマニュアルの管理・共有・検索を一元化できる社内wikiツールです。12,000社以上に導入されており、マニュアルの「作りっぱなし」を防ぐ仕組みづくりをお手伝いしています。

AIで動画からマニュアルを作成するには?Gemini活用の4ステップ

Googleアカウントがあれば、追加のソフトウェアをインストールすることなく、今すぐブラウザ上で試せます。おおまかな流れは「動画の撮影→Geminiへのアップロード→プロンプト入力→出力の確認・修正」の4ステップです。
1. マニュアル化したい操作を画面録画する
最初のステップは、マニュアル化したい操作を録画した動画を用意することです。専用の録画ソフトがなくても、OSに標準搭載されているツールで十分対応できます。
Windowsをお使いであれば、スタートメニューから「Snipping Tool」を起動して画面録画モードを選択します。Macの場合は、Command+Shift+5で「スクリーン収録」のコントロールが表示されます。どちらもOS標準の無料機能です。
保存形式はMP4を選んでください。汎用性が高く、Geminiを含む多くのAIツールに対応しています。1本の動画には1つの操作フロー(1タスク)をまとめるのが基本です。複数の工程を1本に詰め込むと、後述するGeminiの解析精度に影響します。
現場作業の撮影にはスマートフォンで十分です。横向きで撮影すると画面全体が映りやすく、AIが画面の文字や操作箇所を読み取りやすくなります。
2. Geminiに動画ファイルをアップロードする
動画が準備できたら、ブラウザでGeminiを開きます。プロンプト入力欄の左側にある「+」ボタンをクリックし、メニューから「ファイルをアップロード」を選択してください。用意した動画ファイルを選べばアップロードが始まります。
アップロードできる動画の上限は、無料版と有料版で異なります。Google公式ドキュメントによると、無料版(File API)では2GBまで、有料版(1Mコンテキストウィンドウ対応モデル)では最大1時間の動画を処理できます。
対応しているファイル形式は以下のとおりです。
- MP4
- MOV(QuickTime)
- AVI
- WebM
- WMV
- MPG / MPEG
- 3GPP
一般的な画面録画やスマートフォン撮影であればMP4かMOVになるケースがほとんどなので、形式を意識しすぎる必要はありません。アップロードが完了すると、入力欄に動画のサムネイルが表示されます。
3. マニュアル生成用のプロンプトを入力する
プロンプトの書き方次第で、生成されるマニュアルの精度は大きく変わります。「何を」「どんな形式で」「誰向けに」出力してほしいかを具体的に伝えることが、そのまま使えるマニュアルへの近道です。
用途別のサンプルプロンプトを3パターン示します。コピーして使ってみてください。
【基本形】シンプルに手順を出力させる
この動画に映っている操作手順を、ステップごとに番号付きリストでマニュアル化してください。動画に映っている内容のみを対象とし、推測で補完しないでください。
「動画に映っている内容のみ」という制約を加えることで、AIが実際に存在しない手順をもっともらしく補完してしまうリスク(ハルシネーション)を抑えられます。
【形式指定版】読者レベルと出力形式を細かく指定する
この動画の操作手順を、社内システムを初めて使う新入社員向けにマニュアル化してください。出力形式は番号付きリストとし、各ステップに「操作内容」と「注意事項」を含めてください。動画に映っている内容のみを対象とし、推測で補完しないでください。
「新入社員向け」という読者レベルの指定と、「操作内容+注意事項」という項目指定を組み合わせることで、説明の粒度と構成が整います。
【役割付与版】Geminiに専門家の視点を持たせる
あなたは業務マニュアルを専門に作成するテクニカルライターです。この動画の操作手順を、業務経験3年程度の社員が読むことを想定してマニュアル化してください。ステップごとに番号を振り、専門用語には簡単な補足を加えてください。動画に映っている内容のみを対象とし、推測で補完しないでください。
Geminiに「テクニカルライター」という役割を与えると、出力のフォーマットが安定し、説明の文体や粒度が一貫しやすくなります。長い手順マニュアルほど、この効果が顕著です。

4. 生成結果を確認・修正してドキュメント化する
Geminiが出力したテキストは、あくまで下書きです。業務で使う前に、必ず人間の目で確認してください。
確認すべきポイントは主に4つ。
- 手順の順序が動画の流れと一致しているか
- 実際には存在しない手順が混入していないか
- 社内の用語表記が統一されているか
- 不要な補足説明が含まれていないか
特に手順の抜けや事実の誤りは、現場でトラブルを引き起こす原因になるため、動画と丁寧に照合してください。
確認が終わったら、GeminiのCanvas機能を使ってGoogleドキュメントにエクスポートします。Gemini画面の右上にある「キャンバスで開く」を選択すると、生成されたテキストが編集可能な形式で表示されます。そこから「Googleドキュメントにエクスポート」を選べば、Googleドライブに保存完了です。
エクスポート後はGoogleドキュメント上でスクリーンショットを手動で挿入し、各ステップの操作画面を添付します。テキストだけのマニュアルよりも、画像付きのほうが読み手の理解が格段に早まります。フォントや見出しの体裁を整えれば、共有できる状態になります。
AIが生成するのはあくまでたたき台。この段階から人間が仕上げることで、現場で信頼されるマニュアルになります。
動画からのAIマニュアル作成、精度を上げるには?

手順通りにやってみたものの、「生成されたマニュアルが使いものにならなかった」という声は少なくありません。多くの場合、原因は動画の撮り方かプロンプトの書き方のどちらかにあります。
精度を上げる工夫は「動画の撮り方」と「プロンプトの書き方」の2軸に分けて考えると整理しやすくなります。
1. 1工程1動画に分けて撮影する
長い業務プロセスを1本の動画にまとめてしまうと、AIが各ステップを正確に切り出せない場合があります。たとえば「受注入力→在庫確認→出荷指示」という3工程を1本の動画で撮影すると、工程の境目があいまいになり、どこで1ステップが終わって次が始まるかをAIが誤認しやすくなります。
工程ごとに動画を分割して撮影すると、各ステップの抽出精度が向上します。動画1本あたりの長さは2〜5分程度が目安。分割した動画は後でマニュアルとして結合できるので、まずは工程単位で細かく録っておくのがおすすめです。
2. 操作はゆっくり、画面遷移のたびに2〜3秒の間を置く
GeminiをはじめとするマルチモーダルAIは、動画をフレーム単位でサンプリングして画面の変化を解析します。操作が速すぎると、ボタンのクリックや画面の遷移を正しく読み取れません。
画面が切り替わるたびに2〜3秒間そのまま停止してから次の操作に進むだけで、認識精度が上がります。録画の解像度は1920×1080(フルHD)以上を推奨します。文字が小さいシステム画面では、解像度が低いとAIがボタン名やラベルを読み誤る場合があるためです。
「ゆっくり、はっきり」を意識するだけで、生成結果の質は変わります。
3. 音声解説を加えてAIの理解精度を上げる
音声なしの動画でも、Geminiは画面の操作内容をもとにマニュアルを生成できます。ただし、音声解説が加わると生成の質は一段上がります。
画面上の操作だけでは「なぜその操作をしているか」の意図が伝わりません。「ここでフィルタを適用するのは、翌月分のデータだけを抽出するためです」のように口頭で補足しながら録画すると、AIがその意図まで拾い、より文脈に沿ったマニュアルを出力できます。専用マイクは不要で、パソコン内蔵マイクで十分です。
4. プロンプトで出力形式・粒度・読者レベルを指定する
ステップ3で示したプロンプトのポイントと重なりますが、ここでは「なぜその指定が効くか」の理由を中心に補足します。
AIは指定がない場合、出力形式を自分で判断します。その結果、箇条書きになったり説明文になったり、プロンプトを出すたびに形式がぶれることも。「ステップ番号付きリスト形式で」と指定するだけで、出力の構造が固定されます。
粒度の指定も同様です。「初心者向けに」と書けばAIは操作の一つひとつを丁寧に記述し、「経験者向けに」と書けば説明を省略して要点だけを出力します。この調整をプロンプトで行わなければ、AIは中間のどこかを自分で選んでしまいます。
改善前後の比較で見ると効果は明らかです。
| 指定なし(改善前) | 指定あり(改善後) |
| この動画のマニュアルを作ってください。 | この動画の操作手順を、PCの操作に不慣れな新入社員向けに番号付きリスト形式でまとめてください。各ステップに注意事項も含め、専門用語には補足を加えてください。 |
「新人教育用」「引き継ぎ用」などマニュアルの用途を明示すると、Geminiは読み手の文脈を理解したうえで適切な粒度を選びます。用途の一言を添えるだけで、後処理の手間が大幅に減ります。

AIで動画からマニュアルを作成するときの注意点

AIを使ったマニュアル生成は大幅な時間短縮につながりますが、業務利用に先立って確認しておくべき点もあります。リスクを事前に把握し、適切な対策を取れば十分に実用レベルです。
1. ハルシネーション(存在しない手順の生成)への対処
生成AIが「もっともらしいが事実ではない内容」を出力するハルシネーションは、マニュアル生成でも起こりえます。特に注意すべきは、動画に映っていない手順をAIが補完するケース。たとえば「確認ボタンを押す」という操作が動画に映っていなくても、一般的な業務フローから推測してその手順を挿入することがあります。
正確性が求められる現場では、誤った手順が混入したマニュアルが実被害につながりかねません。対策は2つあります。
1つ目はプロンプトへの制約追記です。「動画に映っている内容のみを対象とし、推測で補完しないでください」という一文を加えるだけで、AIが勝手に補完するリスクを軽減できます。2つ目は人間によるダブルチェックです。
生成結果を動画と照合し、手順が一致しているかを確認してから公開するフローを組み込んでください。どちらか一方ではなく、両方を実施するのが現実的な対処法です。
2. 業務画面のAI送信とセキュリティリスク
社内システムや顧客情報が映った動画をクラウドAIに送信する前に、利用規約とデータ取り扱いポリシーの確認が必須です。無料の個人向けサービスでは、入力したデータがモデルの改善に使用される設定になっている場合があります。
法人での利用には、Google Workspaceの有料プランが推奨されます。有料プランでは、ユーザーが入力したデータをGoogleのモデル学習に使用しない設定が適用されます。機密情報を含む業務動画を扱う場合は、個人アカウントではなく組織のGoogle Workspaceアカウントで操作することを社内ルールとして定めておくと安心です。
どうしても個人アカウントしか使えない状況では、顧客名・社員名・口座番号などの個人情報や社外秘の画面が映り込まないよう、録画前に画面を整えてから撮影する方法も有効です。
3. 冗長な出力テキストの整理方法
AIは「網羅性」を重視して出力する傾向があり、マニュアルとして実際には不要な説明が含まれたり、同じ内容が異なる表現で繰り返されたりすることがあります。生成結果をそのまま使うのではなく、後処理で整理する前提で臨んでください。
最も手軽な方法は、生成したテキストをそのままGeminiに渡して「○○文字以内に要約してください」「重複している内容を削除して整理してください」と再依頼すること。一から整理するより、AIに整形させてから人間が最終確認するほうが効率的です。また、最初のプロンプトで「各ステップは1〜2文で簡潔に書いてください」と粒度を指定しておくと、後処理の量を減らせます。
動画からマニュアルを作るその他の方法

動画からマニュアルを作る方法は、Gemini一択ではありません。目的によって「他の汎用AI(ChatGPT・Claude等)」「動画マニュアル専用SaaS」「生成したマニュアルの管理ツール」の3カテゴリから選ぶと整理しやすくなります。
「動画をテキストマニュアルに変換する」ことと「動画そのものをマニュアルとして活用する」ことは、そもそも目的が異なります。前者には汎用AIが向き、後者には専用SaaSが適しています。
ChatGPT・Claudeなど他の生成AIとの違い
ChatGPTやAnthropicのClaudeも動画入力に対応しており、同様の手順でテキストマニュアルを生成できます。基本の流れは「動画アップロード→プロンプト入力→出力確認」とGeminiと同じです。
どのAIを使うかは、普段どのツールを業務で使っているかで選んで構いません。追加の学習コストが最も低い選択肢を選ぶことが、継続的な活用につながります。
| ツール | 対応動画長(有料版) | 料金(目安) | 特徴 |
| Gemini | 最大1時間 | 無料〜(Google One AI Premium:月2,900円) | 長尺動画の処理に強み。Googleドキュメントとの連携がスムーズ |
| ChatGPT | 数分程度(上限変動あり) | 無料〜(Plus:月20ドル) | 出力テキストの自然さに強み。幅広い業務で利用されている |
| Claude | 動画直接入力は制限あり | 無料〜(Pro:月20ドル) | 長文処理・文書整形が得意。テキスト重視の用途に向く |
動画マニュアル作成に特化したSaaS(tebiki・TeachMe Biz・Dive)
動画をテキストに変換するのではなく、動画そのものをマニュアルとして活用したい場合には、専用SaaSが適しています。汎用AIにはない字幕自動付与・多言語翻訳・視聴履歴管理といった機能が、現場での動画マニュアル運用を支えます。
Tebiki(テビキ)

| 項目 | 内容 |
| 運営会社 | Tebiki株式会社 |
| サービス種別 | 現場向け動画マニュアル作成・管理SaaS |
| 主な機能 | AI字幕自動生成、100言語対応の自動翻訳、習熟度テスト、視聴履歴管理 |
| 料金 | 要問い合わせ(無料トライアルあり) |
tebikiは、製造・物流・飲食などの現場業務に強みを持つ動画マニュアルツールです。スマートフォンで撮影した動画をアップロードすると、AIが自動で字幕を生成し、100言語以上に翻訳します。外国人スタッフが多い現場での活用実績も豊富で、チーム全体の教育基盤として活用できます。
TeachMe Biz(ティーチミービズ)

| 項目 | 内容 |
| 運営会社 | 株式会社スタディスト |
| サービス種別 | 手順管理・マニュアル作成SaaS |
| 主な機能 | ステップ形式でのマニュアル作成、動画埋め込み、確認テスト、閲覧状況の管理 |
| 料金 | 要問い合わせ |
TeachMe Bizは、テキストと画像・動画を組み合わせたステップ形式のマニュアルを作成できるSaaSです。マニュアルの閲覧状況や習熟度をチームで管理する機能に強みがあり、研修・OJT場面での活用に向いています。
Dive(ダイブ)

| 項目 | 内容 |
| 運営会社 | エピソテック株式会社 |
| サービス種別 | 動画・AR手順書システム |
| 主な機能 | AI自動手順分割(特許技術)、動画からのステップ自動生成、多言語翻訳、スキルマップ統合 |
| 料金 | 無料プランあり(有料プランは要問い合わせ) |
Diveは、撮影した作業動画をアップロードすると、AIが画像解析と音声認識をもとに手順ごとに自動分割し、ステップ形式の手順書を生成するツールです。各ステップに「作業内容」「コツ」「注意事項」を体系的に整理できるため、動画だけでは伝わりにくい判断基準やノウハウもカバーできます。製造業や現場作業のマニュアル化に強みを持っています。
生成したマニュアルの管理・共有方法
AIを使えばマニュアルの「作成」コストは大幅に下がります。しかし、共有・管理の仕組みがなければ、せっかく作ったマニュアルは個人のフォルダに埋もれ、結局また属人化に戻ってしまいます。
株式会社フィンテックスの調査によると、マニュアルの更新頻度は「不定期」が41.0%、「更新なし」が15.6%。5割以上の組織に明確な管理ルールが存在しません。作成ツールだけを整えても、管理の仕組みを並行して設計しなければ「作りっぱなし」の状態は変わりません。
私たちNotePMは、Geminiで生成したマニュアルの「置き場所」問題を解決するために活用いただける社内wikiツールです。Word・Excel・PDF内のテキストも含めた全文検索、AI要約・翻訳・校正機能、テンプレート、バージョン管理を備えており、「生成→管理→更新」のサイクルを組織として回し続ける仕組みをご用意しています。
マニュアルは「作って終わり」ではなく「使い続ける仕組み」があって初めて機能するもの。生成ツールと管理ツールをセットで検討することで、ナレッジ共有の土台が整います。

まとめ:動画×AIマニュアル作成のポイントと次のステップ

動画×AIでのマニュアル作成で押さえておきたいポイントは、次の3つです。
- Geminiなどの汎用AIに動画をアップロードしてプロンプトを入力するだけで、テキストマニュアルの下書きを数分で生成できる。まず短い操作動画1本で試すのが最初の一歩
- 撮影時の分割・ゆっくりした操作・音声解説と、プロンプトへの形式・粒度・読者レベルの指定を組み合わせることで、生成精度は大きく向上する。最終確認は必ず人間が行う
- AIで作成したマニュアルも、共有・更新の仕組みがなければ使われなくなる。作成ツールと管理ツールをセットで整えることが、属人化の根本的な解消につながる
まず5分以内の短い操作動画を1本録画して、Geminiに投げてみてください。プロンプトは基本形から始めて、出力を見ながら少しずつ調整するのが実践的な進め方です。
総務省「令和7年版 情報通信白書」によると、日本企業の47.3%が「メールや議事録、資料作成等の補助」に生成AIを使用しています。動画からのマニュアル自動生成も、現実的な選択肢として定着しつつあります。
AIで作成したマニュアルをチームで活用し続けるための管理・共有には、NotePMをぜひお試しください。30日間の無料トライアルで全機能をお使いいただけます。
動画×AIの組み合わせでマニュアル作成の手間を大幅に減らし、チーム全体でナレッジを共有できる仕組みを整えていきましょう。
