Powered by NotePM

RIAS Visualization ユーザーマニュアル v.2.2.1

Published on 02/10/2023 11:42
  • 441
RIAS® Visualization
[グラフ作成機能]
 
ユーザーマニュアル
v.2.2.1
2023.10.2
Copyright (c) 2022-2023 Rhelixa, Inc. All rights reserved


このマニュアルは旧版です。 最新版はこちらにあります。

https://rias.rhelixa.com/visualization/manual


はじめに

RIAS Visualization は、次世代シーケンサーデータをはじめとする網羅生命科学データを自在にグラフ化し、その生物学的意義の理解を円滑にすることを目的としています。

RIAS Visualization は、Rhelixaアカウント(無料)を取得して頂き Visualization のライセンスを申し込んで頂いた方にご利用いただけます。こちらにご利用規約がありますので、ご確認・ご了承の上ご利用ください。

RIAS Visualization の活用例

  • 発現量の閾値を変えて、グラフを再作成する
  • 外れ値となるサンプルや不要な遺伝子を除いて、グラフを再作成する
  • 特定の遺伝子に注目してグラフを作成し、発現変動の有意性を評価する
  • 特定の生物学的機能に関わる遺伝子のみのヒートマップを作成する

このマニュアルの利用方法

本マニュアルでは、Visualizationの操作方法と出力結果について説明します。
まず、第1章「概要」第2章「操作の流れ」第3章「ボタンとメニュー」を読んでいただき、概略をつかんでください。
さらに詳しい操作方法は「Heatmap」を例にとった第5章「付録」をご参照ください。
利用したいグラフ(可視化手法)が決まったら、第4章「各可視化手法」の中の必要な項目をお読みください。
その他の情報は第6章以降にありますので、必要に応じてご覧ください。

本マニュアルは、マニュアル作成ツール notePM を利用しています。
画面右側に表示されている目次は、各行をクリックするとその項目の内容の位置へ飛ぶようになっています。

チュートリアル動画を用意しています。本マニュアルと合わせてご利用ください。

謝辞掲載のお願い

RIAS Visualization を利用して得た結果を用いて論文・報告書などを作成・公開した場合には、以下の記載例を参考に謝辞を記載して頂きたく、お願いいたします。

  • This study is performed using the “RIAS Omics Analysis System” provided by Rhelixa Inc.
  • 本研究は、株式会社Rhelixaが提供するRIASオミクス解析補助ツールを利用しました。

目次

画面右側に表示されている目次は、各行をクリックするとその項目の内容の位置へ飛ぶようになっています。ご活用ください。

  1. Visualization v.2.2 の概要

  2. Visualization の操作の流れ
    2.1 ファイルを用意
    2.2 サインイン
    2.3 データファイルのアップロード
    2.4 可視化手法の選択
    2.5 グラフ作成の実行

  3. 画面右上ボタンとRIASプルダウンメニュー
    3.1 画面右上ボタン
    3.2 プルダウンメニュー

  4. 各可視化手法
    4.1 Violin Plot / Box Plot
    4.2 Heatmap
    4.3 Complex Heatmap
    4.4 Venn Diagram
    4.5 2D PCA Scatter Plot
    4.6 3D PCA Scatter Plot
    4.7 Hierarchical Clustering
    4.8 Linear Regression
    4.9 Rotatable Scatter Plot
    4.10 Correlation Matrix
    4.11 Volcano Plot
    4.12 MA Plot
    4.13 Chord Diagram
    4.14 Network Analysis

  5. 付録:Heatmapの操作の詳細説明
    5.1 ファイルを用意する
    5.2. サインインして、Visualization を起動し、Heatmap 画面を表示させる
    5.3 Gene Symbol File の作成
    5.4 ファイルをアップロードする
    5.5 設定を行いグラフ作成する
    5.6 作成されたグラフを確認する
    5.7 作成されたグラフを保存する

  6. よくあるご質問

  7. 用語集

  8. ご利用規定・免責事項

  9. 連絡先


1. Visualization v.2.2 の概要

  1. 以下の可視化手法で遺伝子データをグラフ化できます。
    • Violin Plot
    • Box Plot
    • Heatmap
    • Complex Heatmap
    • Venn Diagram
    • 2D PCA Scatter Plot
    • 3D PCA Scatter Plot
    • Hierarchical Clustering
    • Linear Regression
    • Rotatable Scatter Plot
    • Correlation Matrix
    • Volcano Plot
    • MA Plot
    • Chord Diagram
    • Network Analysis
       
  2. グラフ化は以下を指定することで行います。
    • 可視化手法
    • 元データのファイル(遺伝子情報のデータファイルで、メインファイルと呼ぶ)
    • 補助データファイル(可視化の条件などを決めるデータのファイル)
    • パラメタ(可視化手法によってさまざまな指定項目がある)
       
  3. メインファイルは、遺伝子解析などで得られたデータのファイルです。補助データファイルは、可視化の条件などを決めるもので、元データファイルやグラフ化条件に合わせてExcel などで作ってください。どちらも .tsv か .csv のファイルフォーマットにしてください。
    作り方は各可視化手法の解説の中で説明しています。
     
  4. グラフ作成をすると、作成したグラフと関連データが表示されます。それらは手元PC へダウンロードして保存・利用できます。
    グラフは、文字列・数字が書き込まれたものと書き込まれていないものの2枚が作成されます。グラフ内の文字・数字が目的に沿わない場合には、文字・数字が書き込まれていないグラフに適宜、文字・数字を書き入れてご利用ください。
     
  5. 概ね以下の流れで、元データをグラフ化します。
    1. PCに用意するメインファイル・補助データファイルを手元
    2. Visualization にサインインする
    3. メインファイル・補助データファイルを手元PCからアップロードしておく(アップロード先はクラウド側の RIAS の MyData)
    4. 可視化手法を選ぶ
    5. メインファイル・補助データファイルを MyData から選ぶ
    6. 必要に応じて、パラメタを指定する
    7. グラフ作成を行う
    8. 必要に応じて、補助データファイル・パラメタを変更してグラフを再作成する
    9. 必要に応じて、作成したグラフとデータを手元 PCへダウンロードする
       
  6. Heatmap では、GO term に基づき生物学的機能に関わる遺伝子を選別し、ヒートマップを作成するサポートモジュールが用意されています。 (第5章5.3.2 を参照)


2. Visualization の操作の流れ

チュートリアル動画を用意してあります。本章と合わせてご参照ください。

https://www.youtube.com/watch?v=Wly5hkDoRnk

2.1. ファイルを用意

以下のファイルを手元PCに用意します。 各モジュール画面右上の SampleData ボタンからサンプルデータのファイルをダウンロードできます。

  • メインファイル
    作成するグラフの元データとなるファイルです。
    ファイル名は半角英数字、ファイル内の文字は半角英数字、ファイルフォーマットはCSV形式(カンマ区切りのテキスト)またはTSV形式(タブ区切りのテキスト)です。
    ファイルのデータ構造や作り方は、後の章の各可視化手法の解説の中で説明します。

  • 補助データファイル
    グラフの作成の仕方(データの分類(クラス分け)や区切り方など)を指定するファイルです。可視化手法の種類によって、使う補助データファイルは異なります。また、その補助データファイル無しでグラフを作ることもできる場合もあります。
    ファイル名は半角英数字、ファイル内の文字は半角英数字、ファイルフォーマットはCSV形式(カンマ区切りのテキスト)またはTSV形式(タブ区切りのテキスト)です。
    ファイルのデータ構造や作り方は、後の章の各可視化手法の解説の中で説明します。

2.2. サインイン

<1> ウェブブラウザでRIASのサインインURL(https://rias.rhelixa.com/users/sign_in )にアクセスしてください。
ユーザーごとに発行されたRhelixaアカウントのIDとパスワードを入力し、「サインイン」をクリックしてください。
 初めてのご利用の時には、ここでパスワード登録をしてください
アクセスに成功すれば、「Rhelixaサービスのトップ画面」が表示されます。
082c2f4e-4627-11ee-b77c-061da1ef3444.png?ref=thumb

<2> 初期パスワードの登録や、パスワードが分からなくなった場合などの再登録は、下記の方法で新しいパスワードへ変更してください。

  1. ログイン画面下段の「パスワード登録/再発行」をクリックしてください。
  2. お客様のE-mail addressを入力してください。
  3. 「パスワード登録/再発行用メールを送信」ボタンをクリックしてください。
  4. ”[RIAS] Reset password instructions”というタイトルのメールが届きますので、 ”Change my password”をクリックして開いたページから新しいパスワードを入力し、パスワードを変更してください。

<3> サインインに成功すると、Rhellixa の「Rhelixaサービスのトップ画面」が表示されます。

  1. この中から「RIAS」をクリックしてください。
  2. 「RIASのトップ画面」が表示されます。この中から「Visualization」をクリックしてください。
  3. 「Visualizationのトップ画面」が表示されます。利用できる可視化手法のサンプル図が並んでいます。

図 「Visualization のトップ画面」

c8d7340a-5e96-11ee-aefb-061da1ef3444.png
07603024-4627-11ee-b86b-061da1ef3444.png?ref=thumb
089b6b70-4627-11ee-9381-061da1ef3444.png?ref=thumb

2.3. データファイルのアップロード

手元の PC から MyData へ、以下の手順でファイルをアップロードしてください。

1. トップ画面の右上の「MyDataボタン」をクリックしてください。

2. 以下のMyDataの画面が表示されます。PCからMyDataへファイルをアップロードするために、「Add」をクリックしてください。ファイルをアップロードする画面が表示されます。

07b389fe-4627-11ee-9b1b-061da1ef3444.png?ref=thumb

3. ファイルをアップロードする画面で、「File(Files) to upload」の項目にある「File」の領域をクリックして、手元PCにあるファイルを選択してください。「Drop file」の部分にファイルをドラッグ&ドロップすることでも選択できます。
ファイルが選択されると「File(s) to upload」の下に選択されたファイルのリストが表示されます。
複数のファイルをアップロードする際は、プラスのボタンを押すことで、ファイルアップロードの選択画面が増えます。

4. すべてのファイルの選択が完了したら、「Upload to MyData」ボタンをクリックしてください。 再び MyData のページが表示されます。

image16

5. MyData のページで、目的のデータファイルがアップロードされていることを確認し、ブラウザの戻るボタン「←」をクリックしてください。前の画面に戻ります。

2.4 可視化手法の選択

「トップ画面」には、以下の可視化手法が並んでいます。

  • Violin Plot
  • Box Plot
  • Heatmap
  • Complex Heatmap
  • Venn Diagram
  • 2D PCA Scatter Plot
  • 3D PCA Scatter Plot
  • Hierarchical Clustering
  • Linear Regression
  • Rotatable Scatter Plot
  • Correlation Matrix
  • Volcano Plot
  • MA Plot
  • Chord Diagram
  • Network Analysis

目的の可視化手法の図にマウスカーソルを合わせ、「Open」をクリックすると、その可視化手法のページが表示されます。

2.5. グラフ作成の実行

可視化手法としてHeatmap を選んだ場合を例にして、グラフ作成を実行してみましょう。

2.5.1 Heatmap を起動

「トップ画面」で Heatmap の図にマウスカーソルを合わせると「Open」ボタンが表示されます。

058ea5fa-4627-11ee-89f8-061da1ef3444.png?ref=thumb
056861ba-4627-11ee-91e1-061da1ef3444.png?ref=thumb

「Open」ボタンクリックしてください。「グラフ作成の実行画面」が表示されます。

2.5.2 グラフ作成の実行画面の構成

「グラフ作成の実行画面」には、グラフ作成の条件を指定する「Settingフィールド(上側)」とグラフ作成の結果を表示する「Graph フィールド(下側)」があります。
Graph フィールドには、最初はサンプル画像が表示されています。グラフ作成の実行を行うまでは、実際の元データを反映したものではありません。


図 「グラフ作成の実行画面」のSettingフィールド
07d821ce-4627-11ee-87c1-061da1ef3444.png?ref=thumb

図 「グラフ作成の実行画面」のGraph フィールド
06dd1108-4627-11ee-9281-061da1ef3444.png?ref=thumb

2.5.3 メインファイル選択

MyDataにアップロードしたファイルの中から、グラフ作成をさせたい元データのファイル(メインファイル)を選択するために、まず、Setting フィールドの中の Main File の右端の「ファイル選択ボタン」をクリックしてください。

image24

2.5.4. メインファイル選択(続き)

ホップアップに、MyData にアップロードしてあるファイルが表示されます。目的のファイルの Select ボタンをクリックして、選択してください。

image25

2.5.6. メインファイル選択(続き)

これでメインファイルの指定ができました。
メインファイルを指定しなかった場合には、元からあるサンプルファイルのデータがそのまま使われてグラフ化を行います。
 

2.5.7. 補助ファイル選択・パラメタ指定

必要に応じて、補助データファイル(クラス分けファイルなど)指定やパラメタ設定を行ってください。
補助データファイル指定で「(optional)」とある項目のファイルは、指定しなくても実行できます。
パラメタ指定は変更が必要なければ、そのままのデフォルト設定のままでもグラフ作成は実行できます。
これらの指定の仕方の詳細の説明は、この後に可視化手法ごとに説明してあります。

パラメタ指定の例

例として作成するヒートマップの色を変更します。Base Color から色を選択します。

image26

2.5.8. 描画実行

ファイル指定とパラメタ設定が終わったら、「Execute」ボタンをクリックしてグラフ作成を実行させてください。

65514726-5e97-11ee-ba91-061da1ef3444.png?ref=thumb

2.6. グラフ作成の結果

  1. グラフ作成の結果が 「Graph: フィールド」に表示されます。
    06dd1108-4627-11ee-9281-061da1ef3444.png?ref=thumb

  2. Graphフィールドには、Graph・Empty Graph・MainFile・・などのタブがあり、それぞれを表示させることができます。

    • Graph: 作成したグラフ
    • Empty Graph:上記のグラフから文字・数字を消したもの
    • Main File:Setting で指定したメインファイルの内容(最初の20行のみ表示)
    • Class File: Setting で指定したClass Fileの内容(最初の20行のみ表示)
    • Gene Symbol File: Setting で指定したGene Symbol Fileの内容(最初の20行のみ表示)
    • Extracted Data: オプション指定によりフィルタリングされたデータの内容
    • Reordered Data: クラスタリングで行の並べ替えを行ったデータの内容
      (各表の横スクロールバーは表の最下部にあります。)

    グラフ作成の実行の後には、Graph: フィールドの上側に「Downloadボタン」が現れますので、それをクリックすると作成されたグラフを含む結果が、PCへダウンロードされます。ダウンロードされた結果(グラフや表)は、保存して報告書などに利用することができます。
    あるいは、RIASプルダウンメニューの「Histories」からもダウンロードできます。
    作成されたグラフの文字・数字の大きさやフォントを変えたい・不要な文字数字を消したい、など、グラフ内の文字・数字が目的に沿わない場合には、Empty Graph に文字・数字が無いグラフがありますので適宜、文字・数字を書き入れてご利用ください。


3. 画面右上ボタンとRIAS プルダウンメニュー

3.1. 画面右上ボタン

画面右上には5つのボタンが並んでいます。

95fb531c-5e97-11ee-83cd-06720a606bea.png?ref=thumb

RIAS Top ボタン
Visualizationの一つ上の階層の「RIASのトップページ」が、ブラウザの新しいタブに表示されます。

MyData ボタン
ファイルを保存してある MyData の内容が、ブラウザの新しいタブに表示されます。その中のボタンをクリックすると、以下の操作ができます。
- Add : 手元PC から MyData へファイルをアップロードするための画面が表示されます。
- Delete : MyData の中からそのファイルを消去します。
- Show : そのファイルの内容を表示します。 ただし、グラフ作成結果の .zipファイルの内容の
表示はできません。
- Download: そのファイルを PC へダウンロードします。

SampleData ボタン
それぞれのモジュールで試用するためのサンプルデータの画面が表示されます。適宜、ダウンロードしてご利用ください。

History ボタン
操作の履歴と実行状態が、ブラウザの新しいタブに表示されます。その中のボタンをクリックすると履歴について、下記の操作ができます。
- Retry: その履歴で行った操作を再び実行します。
- Download: その履歴で行った結果のデータをPCにダウンロードします。
- Destroy: その履歴を消去します。
ご注意:
実行状態表示は、表示された時から自動更新はしません。現在の最新の実行状態を知りたいときには、ブラウザの再読み込みボタンをクリックしてください。

Manual ボタン
Visualization のマニュアルが表示されます。

3.2. プルダウンメニュー

画面右上のアイコンにカーソルを合わせると、プルダウンメニューが表示されます。

08777a6c-4627-11ee-aae8-061da1ef3444.png?ref=thumb

プルダウンメニューの各項目をクリックすると、以下の作業ができます。

  • License Status: 利用されているご契約ライセンスやご利用期限などについて表示します。
  • Histories: 「Historyボタン」と同じです。
  • MyData: 「MyDataボタン」とおなじです。
  • Sign out: Visualization を終了して、サインアウトします。


4. 各可視化手法

可視化手法ごとに、入力データのファイルフォーマット・パラメタ(オプション)・作成されるグラフや項目が異なります。

可視化手法 内容
Violin Plot サンプル間における1細胞あたりの検出された遺伝子数の分布を示すデータの各列(各サンプル)についてヴァイオリンプロットを作成します。
Box Plot データの各列(各サンプル)について箱ひげ図を作成し、各サンプルの5数要約(最小・最大・第1・3四分位・平均値)を示す。またサンプルを群としてまとめて、グループ間での比較も可能です。
Heatmap 発現量の異なる遺伝子に基づき、サンプル間の差異を示します。
Complex Heatmap 発現量を指標にサンプル間の差異を比較するに加えて、各サンプルのメタデータ情報を表示することができます。
Venn Diagram 複数の遺伝子名リスト入力からベン図を作成し、さらにベン図内のそれぞれの領域(A ∩ B \ Cなど)に属する遺伝指名リストを出力します。
2D PCA Scatter Plot データから分散の大きい主成分を見出し、サンプルの位置を2次元のプロットに表現することで、サンプル間で区別することができます。
3D PCA Scatter Plot データから分散の大きい主成分を見出し、サンプルの位置を3次元のプロットに表現することで、サンプル間で区別することができます。
Hierarchical Clustering サンプルの類似性や相違性に基づいてクラスタを階層構造で表し、サンプル間で相違性が高いほど遠い位置に分類します。
Linear Regression 2次元の線形回帰を行い回帰直線を作成することで、数値を予測することができます。
Rotatable Scatter Plot データを主成分分析にかけて、回転可能な3次元プロットを描きます。
Correlation Matrix 全サンプル間での相関と散布図を1つの図にまとめて表示します。
Volcano Plot 2群の遺伝子発現量を比較する際に統計的優位性と遺伝子の発現比を示す散布図です。
MA Plot 二群間の平均発現量に対するlog fold changeを表現する散布図です。
Chord Diagram 遺伝子の発現パターンに基づきサンプル間や遺伝子間の関連性をコードダイアグラム形式で描画します。
Network Analysis 遺伝子の発現パターンに基づきサンプル間や遺伝子間の関連性をネットワーク形式で描画します。


4.1 Violin Plot / Box Plot

バイオリン図・箱ひげ図は、各グループごとにサンプルデータのばらつきをバイオリンまたは箱ひげにして可視化する方法です。

複数のグループ間での比較が一目でできます。ある特定の遺伝子について、各グループのサンプルの遺伝子発現量分布(縦軸は遺伝子発現量)を表現します。横軸はグループIDです。バイオリン図の各位置の太さは、その位置に相当する遺伝子発現量を持つサンプルの数を表します。

image33

image34

4.1.1 入力ファイル

  • Main File(必ず必要)
    グラフ作成の元になるデータのメインファイルです。
    このファイルは行列データであって、各列が各サンプル、各行が各変数(多くの場合遺伝子)を示します。1列目には遺伝子名が並び、1行目にはサンプル名が並びます。それ以外のすべてのデータは数値です。数値でないものがあった場合にはエラーになります。ファイル名は半角英数字、ファイル内の文字は半角英数字、ファイルフォーマットは .tsv あるいは .csv にしてください。

    遺伝子名が並ぶ列に同じ遺伝子名が2回以上含まれている場合は、より上の行にある遺伝子名が選択されます。うまく動作しない場合は、遺伝子名に重複がないか確認してください。

    また、RNA-seqのデータをそのまま入れると時間がかかるので、事前に着目する遺伝子のみのファイルを作ることを推奨します。

    Violin Plot / Box Plot画面右上の SampleData ボタンからサンプルデータのファイルをダウンロードできます。

    メインファイルの例(一部分)

    Gene1 ~ Gene8 : 遺伝子名
    A1 ~ B3: サンプル名

GeneID A1 A2 A3 B1 B2 B3
Gene1 3.444981 2.649978 4.079322 0.798433 0.685373 0.879506
Gene2 40.6541 34.2083 50.3686 9.837679 12.13115 11.15724
Gene3 35.68358 28.39499 35.1656 12.85481 17.1148 27.11591
Gene4 39.32014 28.463 39.8371 13.95959 19.56918 13.57346
Gene5 2.36461 3.088101 2.438246 0.083949 0.325994 0.073208
Gene6 67.2229 57.74836 64.43 41.06615 61.25952 67.94272
Gene7 29.82181 34.64335 32.97717 7.041322 8.776047 6.556024
Gene8 11.01882 12.65563 11.12888 1.538414 2.632991 2.211121
 

注意:下記のエラーメッセージが表示された場合は、アップロードしたメインファイルに重複した遺伝子名が記載されていることを示します。

500 Internal Server Error: Error in read.table(file = file, header = header, sep = sep, quote = quote, : duplicate 'row.names' are not allowed

  • Class File(必ず必要)
    どのサンプルがどのグループに属するかを指定するクラス分けファイルです。
    各グループにはサンプルが2つ以上は含まれていることが必要ですので、確認してください。
    このファイルは行列データであり、各列に各サンプル名が記載されており、2行目に各サンプルに対してクラスを割り当てます。なお1行目のサンプル名とMain Fileのサンプル名の名称が異なっても順番が同じであることを確認してください。
    下記の例で示されているようにクラスの指定は文字で振り分けることで、クラス毎にサンプルがグループ分けされます。ファイル名は半角英数字、ファイル内の文字は半角英数字、ファイルフォーマットは .tsv あるいは .csv にしてください。

    (例)
    Class File は以下の構成となります。
    1行目:サンプル名(A1~C3)
    2行目:クラス分け(文字を記載)。この場合、3つのクラスが形成されます。

A1 A2 A3 B1 B2 B3 C1 C2 C3
Class classA classA classA classB classB classB classC classC classC

4.1.2 パラメタ

  • Target gene name(必ず必要)
    「Main File」にある遺伝子のうち、描画したい対象の遺伝子の名前を入力します。遺伝子名が入力ファイルに存在しない場合、エラーになります。

  • Scatter OFF/ON
    実際のサンプル分布を示す点を表示するかどうかを選択します。
    初期設定はオフです。

  • Color fill OFF/ON
    ヴァイオリンプロットや箱ひげ図の内部に色をつけるかどうか選択します。
    初期設定はオンです。

  • Y-axis Min
    縦軸方向の最小値を指定します。

  • Y-axis Max
    縦軸方向の最大値を指定します。

  • Graph Width (px)
    作成されたグラフの横幅(ピクセル)を指定します。
    初期設定は800です。

  • Graph Height (px)
    作成されたグラフの縦幅(ピクセル)を指定します。
    初期設定は600です。

  • Graph Image File Format
    作成したグラフの画像をダウンロードする際のファイル形式を選択します。
    “png”, “jpeg”, “tiff”形式から選択できます。ただし、tiff形式の画像は、ダウンロードはできますが、この Graph: 画面には表示はされません。

4.1.3 グラフ作成の結果

  • Graph
    作成されたグラフが表示されます。

  • Empty Graph
    上記のグラフから文字・数字を消したものが表示されます。
    作成されたグラフの文字・数字の大きさやフォントを変えたい・不要な文字数字を消したい、など、グラフ内の文字・数字が目的に沿わない場合には、こちらに適宜、文字・数字を書き入れてご利用ください。

  • Main File
    Main File」で読み込んだファイルの内容の最初の20行が表示されます。
    ファイルが読み込まれていない場合は、デモデータの内容が表示されます。

  • ClassFile
    「Class File
    」で読み込んだファイルの内容の最初の20行が表示されます。
    ファイルが読み込まれていない場合は、デモデータの内容が表示されます。

  • p-value Table
    Class File」に基づいて分類された全ての群に対して、任意の2つの群に対して統計検定手法の Student's t-test を行い、p 値を出力します。任意の2つの群間の p 値であるため、3群以上で有意水準と比較する際には、Bonferroni 補正などで第一種の過誤の増大を調整する必要があります。

    (各表の横スクロールバーは表の最下部にあります。)


4.2 Heatmap

Heatmapでは、サンプル間での遺伝子発現量の変動を色の濃さで表現します。特定のサンプル群や特定の遺伝子群で、特徴のある遺伝子群が存在するか、それらが全体の中でどのくらいの割合を示すかが視覚的にわかります。これによって、遺伝子がいくつの群に分かれるかを想定して、遺伝子群の同定を行うことができます。

入力されたメインファイルの行列についてヒートマップを描きます。追加で Gene Symbol File (遺伝子名リスト)を入力すると、完全一致でマッチする遺伝子のみで解析・グラフ作成を行うことができます。

※ 計算・作成が終了しない場合は「6. よくあるご質問」をご参照ください。

d1ce7cfc-5e97-11ee-b935-06720a606bea.png?ref=thumb

4.2.1 入力ファイル

  • Main File(必ず必要)
    グラフ作成の元になるデータのメインファイルです。

    行列データであって、各列が各サンプル、各行が各変数(多くの場合遺伝子)を示します。1列目は遺伝子名が並び、1行目はサンプル名が並びます。それ以外のすべてのデータは数値です。数値でないものがあった場合にはエラーになります。ファイル名は半角英数字、ファイル内の文字は半角英数字、ファイルフォーマットは .tsv あるいは .csv にしてください。

    メインファイルの例(一部分)
    Gene1 ~ Gene8 : 遺伝子名
    A1 ~ B3: サンプル名

GeneID A1 A2 A3 B1 B2 B3
Gene1 3.444981 2.649978 4.079322 0.798433 0.685373 0.598215
Gene2 40.6541 34.2083 50.3686 9.837679 12.13115 11.15724
Gene3 35.68358 28.39499 35.1656 12.85481 17.1148 27.11591
Gene4 39.32014 28.463 39.8371 13.95959 19.56918 13.57346
Gene5 2.36461 3.088101 2.438246 0.083949 0.325994 0.073208
Gene6 67.2229 57.74836 64.43 41.06615 61.25952 67.94272
Gene7 29.82181 34.64335 32.97717 7.041322 8.776047 6.556024
Gene8 11.01882 12.65563 11.12888 1.538414 2.632991 2.211121
  • Class File(なくても良い)
    クラス分けファイルです。同一クラスのサンプル名が同一の色になるように塗り分けられます。

    このファイルは行列データであり、各列に各サンプル名が記載されており、2行目に各サンプルに対してクラスを割り当てます。なお1行目のサンプル名と Main File のサンプル名の名称が異なっても順番が同じであることを確認してください。下記の例で示されているようにクラスの指定は文字で振り分けることでクラス毎に色が付けられます。ファイル名は半角英数字、ファイル内の文字は半角英数字、ファイルフォーマットは .tsv あるいは .csv にしてください。

    (例)
    Class File は以下の構成になっています。
    1行目:サンプル名(A1~C3)
    2行目:クラス分け(文字を記載)。下表の場合には、3つのクラス(classA, classB, classC)が形成されます。

A1 A2 A3 B1 B2 B3 C1 C2 C3
Class classA classA classA classB classB classB classC classC classC

- Gene Symbol File(なくても良い)
メインファイルのデータの各行のうち、このファイルに存在する遺伝子名(行名)の行のみを使ってグラフ作成を行います。一列のみの遺伝子名(行名)リストの行列ファイルです。
このファイルが無い場合にはリストが表示されません。
ファイル名は半角英数字、ファイル内の文字は半角英数字、ファイルフォーマットは .tsv あるいは .csv にしてください。

(例)
Gene Symbol Fileは以下の構成になっています。
1行目:Gene_Symbol
2行目以降:該当する遺伝子名(gene symbolで記載)

Gene_Symbol
TSPAN6
TNMD
DPM1
SCYL3
C1orf112
FGR
CFH
FUCA2
GCLC
・ ・ ・
 

このファイルを作成するには、Microsoft Excel などを使う方法と、このRIAS Visualization に含まれているツール Gene Selection Tool を使う方法があります。
Gene Selection Tool を使うと、Gene Ontrogy Term を利用しての高度な遺伝子指定ができます。
Gene Selection Tool を起動するには、「Gene Symbol File (Optional) Gene Selection Tool」の部分をクリックしてください。Gene Selection Tool 」の右側にある「がウェブブラウザの隣のタブに表示されます。
詳しくは、[第5章 Heatmap の操作の説明 5.3]を参照してください。

4.2.2. パラメタ(オプション)

  • Base Color
    グラフの色を指定します。
    以下の9種から選択できます。
    初期設定ではblue-red (青と赤) が選択されています。

    • white - blue
    • white - purple
    • cyan - magenta
    • green - red
    • blue - yellow
    • blue - red
    • blue - white x red
    • black - black - green
  • Color Emphasis level
    作成の色の濃さを指定します。
    以下の3種から選択できます。

    • Low:色コントラストを低に設定
    • Mid:色コントラストを中に設定
    • High:色コントラストを高に設定
  • Scaling into Z-score
    未処理の値で作成するか、Z-scoreにノーマライズした値で作成するかを指定します。
    初期設定ではオンになっています。

  • Draw grid line
    1つ1つの値が表示されているセルを白線で囲むかどうかを指定します。
    初期設定ではオフになっています。
    セルの数が多い場合には、グラフが見にくくなることがあります。

  • Symmetric color
    カラースケールを左右対称にできます。
    初期設定ではオフになっています。

  • Row Clustering
    行方向のクラスタリングの有無を選択できます。
    初期設定ではオンになっています。

  • Column Clustering
    列方向のクラスタリングの有無を選択できます。
    初期設定ではオフになっています。

  • Clustering method
    クラスタリングの手法を指定します。
    以下の3種から選択できます。

    • Ward D
      「凝集型階層的クラスタリング」とも呼ばれます。まず、目標となるクラスタ数が決定されます。次に、クラスタの中で1番重心の距離の近い2つを選び、1つのクラスタに結合する操作を、目標のクラスタ数になるまで続けます。
    • Complete
      ひとつの要素を1クラスタとし、その全てを距離が近い順に結びます。最終的にひとつの大きなクラスタになるまでこの操作を繰り返し、系統図を作成します。この系統図から、クラスタを推定します。
    • Average
      2つのクラスタ間の距離を比較する際に、それぞれのクラスタの任意の2要素の距離の平均を用います。このクラスタ間の距離を近い順に並べ、系統図を作成し、クラスタを推定します。
  • Number of Divergence
    クラスタリング済みの行列を出力する際 (Reordered Data欄)に、ある遺伝子がどのクラスタに属するかを示す列を追加できます。
    初期設定は0で、最大8まで設定可能です。
    系統樹上での分岐回数nをここで指定し、2^n個のクラスタまで分けた際のクラスタ番号を示す列が追加されます。
    例えば分岐回数を4回に指定すると0~15の16個のクラスタ番号が振られることになります。
    4回以上分岐できない部分がある場合は、16個よりも少なくなります。

  • Exclude rows (genes) by normalized values
    |z-score| < (指定値) となる遺伝子を解析・描画の対象から除くことができます。
    初期設定は0です。
    値を大きくすることでサンプル間での変化量の大きい遺伝子のみが選別されます。
    例えば指定値が2のとき、全サンプルが2σ区間から出ない遺伝子は発現量に大きな差がないと見なされ、対象から除かれることになります。

  • Exclude rows (genes) by raw values
    いずれのサンプルでも指定値を超えない遺伝子について、解析・描画の対象から除くことができます。
    初期設定は100です。
    値を大きくすることで、発現量の大きい遺伝子のみが選別されます。

  • Graph Width (px)
    作成されたグラフの横幅(ピクセル)を指定します。
    初期設定は1200です。

  • Graph Height (px)
    作成されたグラフの縦幅(ピクセル)を指定します。
    初期設定は900です。

  • Graph Image File Format
    作成したグラフの画像をダウンロードする際のファイルフォーマットを指定します。
    “png”, “jpeg”, “tiff”形式から選択できます。ただし、tiff形式の画像は、ダウンロードはできますが、この画面には表示はされません。

4.2.3. グラフ作成の結果

  • Graph
    作成されたグラフが表示されます。

  • Empty Graph
    上記のグラフから文字・数字を消したものが表示されます。
    作成されたグラフの文字・数字の大きさやフォントを変えたい・不要な文字数字を消したい、など、グラフ内の文字・数字が目的に沿わない場合には、こちらに適宜、文字・数字を書き入れてご利用ください。

  • Main File
    「Main File」で読み込んだファイルの内容の最初の20行が表示されます。
    ファイルが読み込まれていない場合は、デモデータの内容が表示されます。

  • Class File
    Class File」で読み込んだファイルの内容の最初の20行が表示されます。
    ファイルが読み込まれていない場合は、デモデータの内容が表示されます。

  • Gene Symbol File
    Gene Symbol File」で読み込んだファイルの内容の最初の20行が表示されます。
    ファイルが読み込まれていない場合は、デモデータの内容が表示されます。

  • Extracted Data
    オプション指定によりフィルタリングされたデータの内容の最初の20行が表示されます。

  • Reordered Data
    クラスタリングにより行の並べ替えを行ったデータの内容の最初の20行が表示されます。
    Number of divergenceが0でない場合、それぞれの行の属するクラスタ番号を記した列を追加して出力します。

    (各表の横スクロールバーは表の最下部にあります。)


4.3. Complex Heatmap

Complex Heatmapでは、サンプル間での遺伝子発現量の変動を色の濃さで表現する機能に加え、それぞれのサンプルの遺伝子発現量以外のメタデータも棒グラフや密度グラフとして Complex Heatmap の隣に表示することができます。

これにより、特定のサンプル群や特定の遺伝子群で、特徴のある遺伝子群が存在するか、それらが全体の中でどのくらいの割合を示すかが視覚的にわかるとともに、それぞれの群が遺伝子の発現量以外のどういった特徴をもつかを可視化することができます。結果として、遺伝子がいくつの群に分かれるかを想定して、遺伝子群の同定、さらにその群の特徴を行うことができます。

追加で行または列方向のクラスをグループ分けしたファイルをアップロードすることで、事前に定義したクラスをヒートマップに表示することができます。
また、遺伝子名と対応したメタデータのファイルをアップロードすることで、そのデータを棒グラフとして表示することもできます。

※ 計算・作成が終了しない場合は「6. よくあるご質問」をご参照ください。

image36

4.3.1 入力ファイル

入力ファイルのサンプルデータは、Complex Heatmap画面右上の SampleData ボタンからダウンロードできます。

  • Main File(必ず必要)
    グラフ作成の元になるデータのメインファイルです。
    .tsv あるいは .csv にしてください。こちらのファイルはサンプル間における正規化された発現変動量を表した行列データであり、図を表示させるために必須です。ファイル名は半角英数字、ファイル内の文字は半角英数字、ファイルフォーマットは .tsv あるいは .csv にしてください。

    メインファイルは以下の構成となります:
    1行目:サンプル名
    2行目以降:各遺伝子における正規化させた発現変動量の数値データ
    2行目の1列目の遺伝子名の欄は記載の必要ありません。

(例)

sample1 sample2 sample3 sample4 sample5
gene1 0.9047 -0.3522 0.5016 1.2677 0.8251
gene2 0.9088 0.7916 1.0726 0.0130 0.1392
・・・ ・・・ ・・・ ・・・ ・・・ ・・・
  • Column Class File(なくても良い)
    クラス分けファイルです。パラメタの「Show Column Class」を有効にすることで、同一クラスのサンプルでクラスタリングします。

    このファイルは行列データであり、各列に各サンプル番号名が記載されており、2列目に各サンプルに対してクラスを割り当てます。なお1列目のサンプル番号が Main File のサンプル名の順番に対応していることを確認してください。
    下記の例で示されているようにクラスの指定は番号や名前を振り分けることで、クラス毎にクラスタリングを行うことができます。ファイル名は半角英数字、ファイル内の文字は半角英数字、ファイルフォーマットは .tsv あるいは .csv にしてください。
    このファイルがある場合は、出力された結果のサンプルはこちらのファイルのクラス分類を反映します。ない場合は自動的にK-meansクラスタリングによって分類されます。

    (例)
    Class File は以下の構成です。
    1列目:Main Fileのサンプルと対応した順番。
    2列目:クラス分け。この場合、3つのクラスが形成されます。

Group
gene1 group1
gene2 group2
gene3 group1
gene4 group3
・・・ ・・・
  • Row Class File(なくても良い)

    クラス分けファイルです。パラメタの「Show Row Class」を有効にすることで、同一クラスのサンプルでクラスタリングします。

    このファイルは行列データであり、各列に各サンプル番号名が記載されており、2列目に各サンプルに対してクラスを割り当てます。なお1列目のサンプル番号が Main File のサンプル名の順番に対応していることを確認してください。
    下記の例で示されているようにクラスの指定は番号や名前を振り分けることで、クラス毎にクラスタリングを行うことができます。ファイル名は半角英数字、ファイル内の文字は半角英数字、ファイルフォーマットは .tsv あるいは .csv にしてください。
    このファイルがある場合は、出力された結果の遺伝子はこちらのファイルのクラス分類を反映します。ない場合は自動的にK-meansクラスタリングによって分類されます。

(例)

sample1 sample2 sample3 sample4 sample5 sample6 sample7 ・・・
class group1 group2 group1 group4 group3 group1 group2 ・・・
  • Column Metadata File(なくても良い)

    Main File のサンプルに対する附帯情報が記載されたデータ(メタデータ)のファイルです。こちらのファイルが無い場合でも図は表示されますが、Heatmap 図には遺伝子に関するメタデータは反映されません。メタデータは最大3種類まで入力することが可能です。ファイル名は半角英数字、ファイル内の文字は半角英数字、ファイルフォーマットは .tsv あるいは .csv にしてください。
    このファイルがある場合は、出力された結果に自動的にサンプルのMetadataが表示されます。


    Column Metadata File は以下の構成です。(メタデータを3種類入力する場合)
    1行目:Main Fileにおけるヘッダー(この場合、サンプル名)の順位に一致するサンプル名を記載します。
    2行目:定性データ(薬剤X、Y、Zの振り分け)
    3行目:定性データ(薬剤投与の経過時間の振り分け)
    4行目:定量データ(薬剤に対する反応)

sample1 sample2 sample3 sample4 sample5 sample6 sample7 sample8
metadata_1 a b a c b b c a
metadata_2 f e b d b a e f
metadata_3 1.5 0.2 0.4 1.3 2 1 0.3 0.2
  • Row Metadata File(なくても良い)
    Main File の遺伝子に対する附帯情報が記載されたデータ(メタデータ)のファイルです。こちらのファイルが無い場合でも図は表示されますが、Heatmap図にはサンプルに関するメタデータは反映されません。メタデータは最大3種類まで入力することが可能です。
    ファイル名は半角英数字、ファイル内の文字は半角英数字、ファイルフォーマットは .tsv あるいは .csv にしてください。
    このファイルがある場合は、出力された結果に自動的に遺伝子のMetadataが表示されます。

    (例)
    Row Metadata File は以下の構成となります。(メタデータを3種類入力する場合。)
    1行目:Main File におけるヘッダー(この場合、サンプル名)順位と一致する遺伝子名
    1列目~3列目:定性データ(遺伝子の機能、特徴等)

metadata_1 metadata_2 metadata_3
gene1 c f d
gene2 b e e
gene3 a f e
gene4 a f c
gene5 c d h
gene6 b h d
gene7 b g d
gene8 c g d
・・・ ・・・ ・・・ ・・・

4.3.2 パラメタ

  • Plot Box Plot of Column Class
    Column class fileをアップロードしている場合のみ、行方向のクラスごとに色分けされた箱ひげ図をグラフの右側に作成します。初期設定ではオフになっています

  • Exclude rows (genes) by normalized values
    |z-score| < (指定値) となる遺伝子を解析・描画の対象から除くことができます。
    初期設定は0です。
    値を大きくすることでサンプル間での変化量の大きい遺伝子のみが選別されます。
    例えば指定値が2のとき、全サンプルが2σ区間から出ない遺伝子は発現量に大きな差がないと見なされ、対象から除かれることになります。

  • Exclude rows (genes) by raw values
    いずれのサンプルでも指定値を超えない遺伝子について、解析・描画の対象から除くことができます。
    初期設定は100です。
    値を大きくすることで、発現量の大きい遺伝子のみが選別されます。

  • Classwise Box Plot Length
    箱ひげ図の横幅を指定します。

  • Show Each Row as Density Graph
    列方向のデータの分布を密度グラフとしてHeatmapの右側に表示します。
    初期設定ではオフになっています。

  • Density Graph Length (px)
    密度グラフの横幅を指定します。密度グラフを表示するオプションを選択した場合にのみ反映されます。

  • Density Graph Scale
    密度グラフの横軸の範囲を指定します。
    密度グラフを表示するオプションを選択した場合にのみ反映されます。
    以下の3種から選択できます。

    • Linear: 横軸は実数目盛りをとります。
    • log 2: 横軸はログスケール(log2)の目盛りを取ります。
    • log10: 横軸はログスケール(log10)の目盛りを取ります。
  • Clustering Method
    クラスタリングの手法を指定します。
    以下の4種から選択できます。

    • Ward D
      「凝集型階層的クラスタリング」とも呼ばれます。まず、目標となるクラスタ数が決定されます。次に、クラスタの中で1番重心の距離の近い2つを選び、1つのクラスタに結合する操作を、目標のクラスタ数になるまで続けます。

    • Ward D2
      基本的なアルゴリズムは「Ward D」と差はありませんが、クラスタ間の距離を二乗して計算します。

    • Complete
      ひとつの要素を1クラスタとし、その全てを距離が近い順に結びます。最終的にひとつの大きなクラスタになるまでこの操作を繰り返し、系統図を作成します。この系統図からクラスタを推定します。

    • Average
      2つのクラスタ間の距離を比較する際に、それぞれのクラスタの任意の2要素の距離の平均を用います。このクラスタ間の距離を近い順に並べ、系統図を作成し、クラスタを推定します。

  • Scaling into Z-score
    入力値をZスコア化します。
    初期設定はオンになっています。

  • Base Color
    グラフの色を指定します。
    以下の9種から選択できます。

    • white - blue
    • white - purple
    • cyan - magenta
    • green - red
    • blue - yellow
    • blue - red
    • blue - white x red
    • black - black - green
  • Max value of heatmap colorbar. Leave empty for auto.
    カラーバーの最大値を指定します。
    入力値がない場合、自動的に入力データの最大値をカラーバーの最大値とします。

  • Min value of heatmap colorbar. Leave empty for auto.
    カラーバーの最小値を指定します。
    入力値がない場合、自動的に入力データの最小値をカラーバーの最小値とします。

  • X-axis Dendrogram Length
    Heatmapの上部に表示される系統樹の縦幅を指定します。

  • Y-axis Dendrogram Length
    Heatmapの左側に表示される系統樹の横幅を指定します。

  • Row Label Option
    行方向の遺伝子名の表示設定を指定します。
    以下の3種から選択できます。

    • Automatic: 名前が30文字以上の場合、遺伝子名を非表示にします。
    • Show all: 名前の長さに関係なく、名前を表示します。
    • Do not show: 名前を非表示にします。
      初期設定はAutomaticになっています。
  • Column Label Option
    列方向のサンプル名の表示設定を指定します。
    以下の3種から選択できます。初期設定はAutomaticになっています。

    • Automatic: 名前が30文字以上の場合、サンプル名を非表示にします。
    • Show all: 名前の長さに関係なく、名前を表示します。
    • Do not show: 名前を非表示にします。
  • Graph Width (px)
    作成されたグラフの横幅(ピクセル)を指定します。
    初期設定は1200です。

  • Graph Height (px)
    作成されたグラフの縦幅(ピクセル)を指定します。
    初期設定は900です。

  • Graph Image File Format
    作成したグラフの画像をダウンロードする際のファイルフォーマットを指定します。
    “png”, “jpeg”, “tiff”形式から選択できます。
    ただし、tiff形式の画像は、ダウンロードはできますが、この画面には表示はされません。

4.3.3 グラフ作成の結果

  • Graph
    作成されたグラフが表示されます。

  • Empty Graph
    上記のグラフから文字・数字を消したものが表示されます。
    作成されたグラフの文字・数字の大きさやフォントを変えたい・不要な文字数字を消したい、など、グラフ内の文字・数字が目的に沿わない場合には、こちらに適宜、文字・数字を書き入れてご利用ください。

  • Main File
    「Main File」で読み込んだファイルの内容の最初の行が表示されます。
    ファイルが読み込まれていない場合は、デモデータの内容が表示されます。

  • Column Metadata File
    Column Metadata File」で読み込んだデータの内容の最初の20行が表示されます。
    Column Metadata File」を指定しなかった場合には、このタブは表示されません。

  • Row Metadata File
    Row Metadata File」で読み込んだデータの内容の最初の20行が表示されます。
    Row Metadata File」を指定しなかった場合には、このタブは表示されません。

  • Extracted Data
    オプション指定によりフィルタリングされたデータの内容の最初の20行が表示されます。

    (各表の横スクロールバーは表の最下部にあります。)


4.4. Venn Diagram

ベン図とは、複数の集合の関係や、集合の範囲を視覚的に図式化したものです。

異なるデータセット間で共通の要素がどのくらい存在するかを可視化します。
複数の遺伝子名リスト入力からベン図を作成し、さらにベン図内のそれぞれの領域(A ∩ B \ Cなど)に属する遺伝指名リストを出力します。

image37

4.4.1. 入力ファイル

入力ファイルのサンプルデータは、Venn Diagram画面右上の SampleData ボタンからダウンロードできます。

  • Main File1, Main File 2, etc…(必ず2つ以上必要)
    グラフ作成の対象になる元データファイルです。
    他の可視化手法と異なり、2つ以上の入力ファイルを必要とします。
    この元データファイルは、1行目がヘッダーラベル、それ以降の行に遺伝子名を含んだ、1列の遺伝子名リストとなっています。それぞれが1列の遺伝子名リストとなっています。
    行列形式のファイルが入力された場合、それぞれの行名をグラフ化の対象の要素として使い、1列目の各行名を解析の対象の要素として使います。ファイル名は半角英数字、ファイル内の文字は半角英数字、ファイルフォーマットは .tsv あるいは .csv にしてください。

4.4.2. パラメタ(オプション)

  • Graph Width (px)
    作成されたグラフの横幅(ピクセル)を表記しています。
    初期設定は700です。

  • Graph Height (px)
    作成されたグラフの縦幅(ピクセル)を表記しています。
    初期設定は700です。

  • Proportional area size
    それぞれの円の面積を要素数に比例した大きさに設定します。初期設定はオンになっています。

  • Graph Image File Format
    作成したグラフの画像をダウンロードする際のファイル形式を選択します。
    “png”, “jpeg”, “tiff”形式から選択できます。
    ただし、tiff形式の画像は、ダウンロードはできますが、この画面には表示はされません。

4.4.3. グラフ作成の結果

  • Graph
    作成されたグラフが表示されます。ベン図内のそれぞれの領域には、その領域に含まれる要素数と、その要素数が全ての要素の何%を閉めているかを示す数値が表示されます。

  • Empty Graph
    上記のグラフから文字・数字を消したものが表示されます。ただし、一部の文字・数字は残ります。
    作成されたグラフの文字・数字の大きさやフォントを変えたい・不要な文字数字を消したい、など、グラフ内の文字・数字が目的に沿わない場合には、こちらに適宜、文字・数字を書き入れてご利用ください。

  • Gene Lists
    重複の無いように各遺伝子名リストをユニーク化、大文字化したものについて、各領域(A ∩ B \Cなど)に属する遺伝子名リストを表形式で出力します。

  • 入力ファイル(Main File1, Main File 2, etc…)
    「Main File1, Main File 2, etc…」で読み込んだファイルがそれぞれ個別のタブとして表示されます。それぞれのファイルに対して、内容の最初の20行が表示されます。
    (横スクロールバーは表の最下部にあります。)


4.5. 2D PCA Scatter Plot

主成分分析は、相関のある多数の変数から相関のない少数で全体のばらつきを最もよく表す「主成分」と呼ばれる変数を合成する多変量解析の一手法です。データの次元を削減するために用いられます。 主成分を用いて各サンプルをマッピングし、2次元空間でサンプル間の遺伝子発現傾向の類似性を評価することができます。また、主成分を形成する重みを取得することで、サンプル間の差異を規定する遺伝子を予測できます。 2D PCA Scatterplot では、メインファイルの元データを主成分分析し、第一主成分(PC1)と第二主成分(PC2)による二次元の散布図を作成します。

クラス分け用のファイルを指定すると、プロットの色分け・形の変更ができます。

image38

4.5.1. 入力ファイル

  • Main File(必ず必要)
    グラフ作成の元になるデータのメインファイルです。
    行列データであって、各列が各サンプル、各行が各変数(多くの場合遺伝子)を示します。
    1列目は遺伝子名が並び、1行目はサンプル名が並びます。それ以外のすべてのデータは数値です。数値でないものがあった場合にはエラーになります。ファイル名は半角英数字、ファイル内の文字は半角英数字、ファイルフォーマットは .tsv あるいは .csv にしてください。

  • Class File(なくても良い)
    クラス分けファイルです。同一クラスのサンプルが同一の色になるように塗り分けられます。
    クラス分けファイルは行列データで、列数はメインファイルと等しく、1行目は遺伝子名が並び、2行目の各列には遺伝子クラス分け用の識別子が入っています。
    Excel などで作成し、PC から MyData へアップロードしておいてください。ファイル名は半角英数字、ファイル内の文字は半角英数字、ファイルフォーマットは .tsv あるいは .csv にしてください。

4.5.2. パラメタ(オプション)

  • Display sample name
    散布図にサンプル名を表示するかを指定できます。
    初期設定ではオンになっています。

  • Adjust scale to contribution rate
    寄与率に応じてPC1 / PC2のグラフの幅を変えるか指定できます。
    初期設定ではオフになっています。

  • Change plot color with class
    クラスごとにサンプルIDの色付けをするかを指定できます。
    初期設定ではオンになっています。

  • Change plot shape with class
    各クラスでマーカーの形を変えるかを指定できます。
    初期設定ではオンになっています。

  • Exclude rows (genes) by normalized values
    Z-scoreに基づきクラスタリングに使用する遺伝子を選別することができます。
    初期設定は0です。
    値を大きくすることで、より変化量の大きい遺伝子のみでクラスタリングが行われます。

  • Exclude rows (genes) by raw values
    最大値に基づきクラスタリングに使用する遺伝子を選別することができます。
    初期設定は10です。
    値を大きくすることで、より発現量の大きい遺伝子のみでクラスタリングが行われます。

  • Graph Width (px)
    作成されたグラフの横幅(ピクセル)を表記しています。
    初期設定は800です。

  • Graph Height (px)
    作成されたグラフの縦幅(ピクセル)を表記しています。
    初期設定は600です。

  • Graph Image File Format
    作成したグラフの画像をダウンロードする際のファイル形式を選択します。
    “png”, “jpeg”, “tiff”形式から選択できます。
    ただし、tiff形式の画像は、ダウンロードはできますが、この画面には表示はされません。

4.5.3. グラフ作成の結果

  • Graph
    作成されたグラフが表示されます。

  • Empty Graph
    上記のグラフから文字・数字を消したものが表示されます。
    作成されたグラフの文字・数字の大きさやフォントを変えたい・不要な文字数字を消したい、など、グラフ内の文字・数字が目的に沿わない場合には、こちらに適宜、文字・数字を書き入れてご利用ください。

  • Main File
    Main File」で読み込んだファイルの内容の最初の20行が表示されます。
    ファイルが読み込まれていない場合は、デモデータの内容が表示されます。

  • Class File 「Class File」で読み込んだファイルの内容の最初の20行が表示されます。
    ファイルが読み込まれていない場合は、デモデータの内容が表示されます。

  • Extracted Data
    オプション指定によって選別されたデータの内容の最初の20行が表示されます。

  • PC Matrix Data
    各種成分でマッピングしたときの値が表示されます。

  • PCA Summary
    Standard deviation(各主成分の標準偏差)、Proportion of variance(各主成分の寄与率)、Cumulative proportion(累積寄与率)を表示します。

ffd7f490-4626-11ee-b12a-061da1ef3444.png?ref=thumb

(各表の横スクロールバーは表の最下部にあります。)



4.6. 3D PCA Scatter Plot

主成分分析は、相関のある多数の変数から相関のない少数で全体のばらつきを最もよく表す「主成分」と呼ばれる変数を合成する多変量解析の一手法です。データの次元を削減するために用いられます。

 
主成分を用いて各サンプルをマッピングし、3次元空間でサンプル間の遺伝子発現傾向の類似性を評価することができます。また、主成分を形成する重みを取得することで、サンプル間の差異を規定する遺伝子を予測できます。
 
3D PCA Scatter Plot では、メインファイルの元データを主成分分析し、それぞれ第一主成分(PC1)と第二主成分(PC2)による二次元の散布図、第一主成分(PC1)から第三主成分(PC3)による三次元の散布図を作成します。
クラス分け用のファイルを指定すると、プロットの色分けの変更ができます。

image40

4.6.1. 入力ファイル

入力ファイルのサンプルデータは、3D PCA Scatter Plot画面右上の SampleData ボタンからダウンロードできます。

  • Main File(必ず必要)
    グラフ作成の元になるデータのメインファイルです。
    行列データであって、各列が各サンプル、各行が各変数(多くの場合遺伝子)を示します。
    1列目は遺伝子名が並び、1行目はサンプル名が並びます。それ以外のすべてのデータは数値です。数値でないものがあった場合にはエラーになります。
    ファイル名は半角英数字、ファイル内の文字は半角英数字、ファイルフォーマットは .tsv あるいは .csv にしてください。

    メインファイルの例(一部分)
    Gene1 ~ Gene8 : 遺伝子名
    A1 ~ B3: サンプル名

GeneID A1 A2 A3 B1 B2 B3
Gene1 3.444981 2.649978 4.079322 0.798433 0.685373 0.879506
Gene2 40.6541 34.2083 50.3686 9.837679 12.13115 11.15724
Gene3 35.68358 28.39499 35.1656 12.85481 17.1148 27.11591
Gene4 39.32014 28.463 39.8371 13.95959 19.56918 13.57346
Gene5 2.36461 3.088101 2.438246 0.083949 0.325994 0.073208
Gene6 67.2229 57.74836 64.43 41.06615 61.25952 67.94272
Gene7 29.82181 34.64335 32.97717 7.041322 8.776047 6.556024
Gene8 11.01882 12.65563 11.12888 1.538414 2.632991 2.211121
  • Class File(なくても良い)
    クラス分けファイルです。同一クラスのサンプル名が同一の色になるように塗り分けられます。

    このファイルは行列データであり、各列に各サンプル名が記載されており、2行目に各サンプルに対してクラスを割り当てます。なお1行目のサンプル名と Main File のサンプル名の名称が異なっても順番が同じであることを確認してください。
    下記の例で示されているようにクラスの指定は文字で振り分けることで、クラス毎に色が付けられます。
    ファイル名は半角英数字、ファイル内の文字は半角英数字、ファイルフォーマットは .tsv あるいは .csv にしてください。

    (例)
    Class File は以下の構成となります。
    1行目:サンプル名(A1~C3)
    2行目:クラス分け(文字を記載)。このデータの場合は3つのクラスが形成されます。

A1 A2 A3 B1 B2 B3 C1 C2 C3
Class classA classA classA classB classB classB classC classC classC

4.6.2. パラメタ(オプション)

  • Exclude rows (genes) by normalized values
    Z-scoreに基づきクラスタリングに使用する遺伝子を選別することができます。
    初期設定は0です。
    値を大きくすることで、より変化量の大きい遺伝子のみでクラスタリングが行われます。

  • Exclude rows (genes) by raw values
    最大値に基づきクラスタリングに使用する遺伝子を選別することができます。
    初期設定は10です。
    値を大きくすることで、より発現量の大きい遺伝子のみでクラスタリングが行われます。

  • Graph Width (px)
    作成されたグラフの横幅(ピクセル)を表記しています。
    初期設定は800です。

  • Graph Height (px)
    作成されたグラフの縦幅(ピクセル)を表記しています。
    初期設定は600です。

  • Graph Image File Format
    作成したグラフの画像をダウンロードする際のファイル形式を選択します。
    “png”, “jpeg”, “tiff”形式から選択できます。
    ただし、tiff形式の画像は、ダウンロードはできますが、この画面には表示はされません。

4.6.3. グラフ作成の結果

  • Graph
    作成されたグラフが表示されます。

  • Empty Graph
    上記のグラフから文字・数字を消したものが表示されます。
    作成されたグラフの文字・数字の大きさやフォントを変えたい・不要な文字数字を消したい、など、グラフ内の文字・数字が目的に沿わない場合には、こちらに適宜、文字・数字を書き入れてご利用ください。

  • Main File
    Main File」で読み込んだファイルの内容の最初の20行が表示されます。
    ファイルが読み込まれていない場合は、デモデータの内容が表示されます。

  • Class File 「Class File」で読み込んだファイルの内容の最初の20行が表示されます。
    ファイルが読み込まれていない場合は、デモデータの内容が表示されます。

  • Extracted Data
    オプション指定によって選別されたデータの内容の最初の20行が表示されます。

  • PC Matrix Data
    各種成分でマッピングしたときの値が表示されます。

  • PCA Summary
    Standard deviation(各主成分の標準偏差)、Proportion of variance(各主成分の寄与率)、Cumulative proportion(累積寄与率)を表示します。

002feb6e-4627-11ee-b3de-061da1ef3444.png?ref=thumb

(各表の横スクロールバーは表の最下部にあります。)



4.7 Hierarchical Clustering

対象間の距離に基づいて、距離の近いもの同士を1つのグループ(クラスタ) に順次にまとめていく方法です。生成されたクラスタがさらに上位のクラスタにまとめられていくため、分類結果は階層構造を持つものとなります。階層構造は系統図と呼ばれる図で可視化されます。クラスタ間の距離の定義のしかたが異なる複数の方法があり、方法の違い、距離の尺度の違いによって結果が異なります。

本モジュールではユークリッド距離を指標にサンプル間の類似性を評価します。縦軸に示されている Height の値はサンプル間の非類似性指数(Dissimiliarity Score)を示し、この数値が高ければ分類されたサンプルの類似度が低いことを表します。非類似性指数の計算方法はクラスタリング手法によって変わってきます。

データを取得した際に、想定したグループが近い距離にまとまるか、または外れたサンプルがないかの評価に使用します。この結果により、どのようなサンプル群の比較が有効かを想定することができます。

各サンプル(各列)に対して階層的クラスタリングを行い、系統樹を作成します。

image42

4.7.1. 入力ファイル

入力ファイルのサンプルデータは、Hierarchical Clustering画面右上の SampleData ボタンからダウンロードできます。

  • Main File(必ず必要)
    グラフ作成の元になるデータのメインファイルです。

    行列データであって、各列が各サンプル、各行が各変数(多くの場合遺伝子)を示します。1列目は遺伝子名が並び、1行目はサンプル名が並びます。それ以外のすべてのデータは数値です。数値でないものがあった場合にはエラーになります。ファイル名は半角英数字、ファイル内の文字は半角英数字、ファイルフォーマットは .tsv あるいは .csv にしてください。

    メインファイルの例(一部分)
    Gene1 ~ Gene8 : 遺伝子名
    A1 ~ B3: サンプル名

GeneID A1 A2 A3 B1 B2 B3
Gene1 3.444981 2.649978 4.079322 0.798433 0.685373 0.879506
Gene2 40.6541 34.2083 50.3686 9.837679 12.13115 11.15724
Gene3 35.68358 28.39499 35.1656 12.85481 17.1148 27.11591
Gene4 39.32014 28.463 39.8371 13.95959 19.56918 13.57346
Gene5 2.36461 3.088101 2.438246 0.083949 0.325994 0.073208
Gene6 67.2229 57.74836 64.43 41.06615 61.25952 67.94272
Gene7 29.82181 34.64335 32.97717 7.041322 8.776047 6.556024
Gene8 11.01882 12.65563 11.12888 1.538414 2.632991 2.211121
  • Class File(なくても良い)
    クラス分けファイルです。同一クラスのサンプルが同一の色になるように塗り分けられます。クラス分けファイルは行列データで、列数はメインファイルと等しく、1行目は遺伝子名が並び、2行目の各列には遺伝子クラス分け用の識別子が入っています。

    Excel などで作成し、PCからMyDataへアップロードしておいてください。ファイル名は半角英数字、ファイル内の文字は半角英数字、ファイルフォーマットは .tsv あるいは .csv にしてください。

    (例)
    Class File は以下の構成になっています。
    1行目:サンプル名(A1~C3)
    2行目:クラス分け(文字を記載)。この場合、3つのクラスが形成されます。

A1 A2 A3 B1 B2 B3 C1 C2 C3
Class classA classA classA classB classB classB classC classC classC

4.7.2. パラメタ

  • Fix Sample Order OFF/ON
    系統樹に並べるサンプルの順番を、入力ファイルと同じ順に固定するか否かを選択できます。
    系統樹の形によっては、順番を固定すると枝が交差してしまう場合があります。

  • Clustering method
    クラスタリングの手法を選択できます。
    以下の選択肢があります。

    • Ward D
      「凝集型階層的クラスタリング」とも呼ばれます。まず、目標となるクラスタ数が決定されます。次に、クラスタの中で1番重心の距離の近い2つを選び、1つのクラスタに結合する操作を、目標のクラスタ数になるまで続けます。

    • Complete
      ひとつの要素を1クラスタとし、その全てを距離が近い順に結びます。最終的にひとつの大きなクラスタになるまでこの操作を繰り返し、系統図を作成します。この系統図から、クラスタを推定します。

    • Average
      2つのクラスタ間の距離を比較する際に、それぞれのクラスタの任意の2要素の距離の平均を用います。このクラスタ間の距離を近い順に並べ、系統図を作成し、クラスタを推定します。

  • Exclude rows (genes) by normalized values
    Z-scoreに基づきクラスタリングに使用する遺伝子を選別することができます。
    初期設定は0です。
    値を大きくすることで、より変化量の大きい遺伝子のみでクラスタリングを行うことができます。

  • Exclude rows (genes) by raw values
    最大値に基づきクラスタリングに使用する遺伝子を選別することができます。
    初期設定は10です。
    値を大きくすることで、より発現量の大きい遺伝子のみでクラスタリングが行われます。

  • Graph Width (px)
    作成されたグラフの横幅(ピクセル)を表記しています。
    初期設定は800です。

  • Graph Height (px)
    作成されたグラフの縦幅(ピクセル)を表記しています。
    初期設定は600です。

  • Graph Image File Format
    作成したグラフの画像をダウンロードする際のファイル形式を選択します。
    “png”, “jpeg”, “tiff”形式から選択できます。ただし、tiff形式の画像は、ダウンロードはできますが、この画面には表示はされません。

4.7.3. グラフ作成の結果

  • Graph
    作成されたグラフが表示されます。

  • Empty Graph
    上記のグラフから文字・数字を消したものが表示されます。
    作成されたグラフの文字・数字の大きさやフォントを変えたい・不要な文字数字を消したい、など、グラフ内の文字・数字が目的に沿わない場合には、こちらに適宜、文字・数字を書き入れてご利用ください。

  • Main File
    「Main File」で読み込んだファイルの内容の最初の20行が表示されます。
    ファイルが読み込まれていない場合は、デモデータの内容が表示されます。

  • Class File
    「Class File」で読み込んだファイルの内容の最初の20行が表示されます。
    ファイルが読み込まれていない場合は、デモデータの内容が表示されます。

  • Extracted Data
    オプション指定でフィルタリングされたデータの内容の最初の20行が表示されます。

    (各表の横スクロールバーは表の最下部にあります。)


4.8. Linear Regression

Linear Regression(線形回帰)では、2次元のデータについて散布図と回帰直線を描きます。

主にレプリケイト間のデータでどのくらいの再現性があるかを評価するために用います。

image43

4.8.1. 入力ファイル

  • Main File(必ず必要)
    グラフ作成の元になるデータのメインファイルです。2つのサンプルにおける相関性を評価するための行列データのファイルです。両サンプルの遺伝子の発現量をプロットさせたあと、曲線の関数と決定係数が計算されます。
    ファイル名は半角英数字、ファイル内の文字は半角英数字、ファイルフォーマットは .tsv あるいは .csv にしてください。

    メインファイルの構成は以下の通りです:

    1行目:メインファイルのヘッダー
    1列目:遺伝子リスト
    2・3列目:サンプル毎の遺伝子の発現量

Gene_ID Sample1 Sample2
TSPAN6 29.79 32.25
TNMD 0 0
DPM1 29 38.47









4.8.2. オプション

  • Use Logarithmic Scale
    対数スケールでグラフを作成することができます。
    グラフ上での見かけは線型になりますが、実際の回帰式としては log y = a * log(x) + b という形になります。
    初期設定ではオンになっています。

  • Select X-axis Column
    X軸に使用するサンプルを選択します。

  • X-axis Min
    グラフの表示におけるX軸の最小値を指定します。
    初期設定は0です。
    回帰式を構築する場合もこの値以上のデータポイントが用いられます。

  • X-axis Max
    グラフの表示におけるX軸の最大値を指定します。
    回帰式を構築する場合、この値以下のデータポイントが用いられます。

  • Select Y-axis Column
    Y軸に使用するサンプルを選択します。

  • Y-axis Min
    グラフの表示におけるY軸の最小値を指定します。
    初期設定は0です。
    回帰式を構築する場合、この値以上のデータポイントが用いられます。

  • Y-axis Max
    グラフの表示におけるY軸の最大値を指定します。
    回帰式を構築する場合、この値以下のデータポイントが用いられます。

  • Graph Width (px)
    作成されたグラフの横幅(ピクセル)を表記しています。
    初期設定は800です。
    横幅の大小は設定値を変えることで可能になります。

  • Graph Height (px)
    作成されたグラフの縦幅(ピクセル)を表記しています。
    初期設定は600です。
    縦幅の大小は設定値を変えることで可能になります。

  • Graph Image File Format
    作成したグラフの画像をダウンロードする際のファイル形式を選択します。
    “png”, “jpeg”, “tiff”形式から選択できます。
    ただし、tiff形式の画像は、ダウンロードはできますが、この画面には表示はされません。

4.8.3. グラフ作成の結果

  • Graph
    作成されたグラフが表示されます。

  • Empty Graph
    上記のグラフから文字・数字を消したものが表示されます。
    作成されたグラフの文字・数字の大きさやフォントを変えたい・不要な文字数字を消したい、など、グラフ内の文字・数字が目的に沿わない場合には、こちらに適宜、文字・数字を書き入れてご利用ください。

  • Main File
    Main File」で読み込んだファイルの内容の最初の20行が表示されます。
    ファイルが読み込まれていない場合は、デモデータの内容が表示されます。

  • Regression Function Summary
    線形回帰の結果を切片、傾きを示して y = ax + b または log y = alog x + b という形で表示します。
    Intercept: 回帰直線の切片
    Inclination: 回帰直線の傾き
    Equation: 回帰直線の式

    (各表の横スクロールバーは表の最下部にあります。)


4.9. Rotatable Scatter Plot

Rotatable Scatter Plotは基本的に3D PCA Scatter Plotと同様ですが、回転可能な3次元散布図を作成します。

image44

4.9.1. 入力ファイル

入力ファイルのサンプルデータは、Rotatable Scatter Plot画面右上の SampleData ボタンからダウンロードできます。

  • Main File(必ず必要)
    グラフ作成の元になるデータのメインファイルです。

    行列データであって、各列が各サンプル、各行が各変数(多くの場合遺伝子)を示します。1列目は遺伝子名が並び、1行目はサンプル名が並びます。それ以外のすべてのデータは数値です。数値でないものがあった場合にはエラーになります。ファイル名は半角英数字、ファイル内の文字は半角英数字、ファイルフォーマットは .tsv あるいは .csv にしてください。

    メインファイルの例(一部分)
    Gene1 ~ Gene8 : 遺伝子名
    A1 ~ B3: サンプル名

GeneID A1 A2 A3 B1 B2 B3
Gene1 3.444981 2.649978 4.079322 0.798433 0.685373 0.879506
Gene2 40.6541 34.2083 50.3686 9.837679 12.13115 11.15724
Gene3 35.68358 28.39499 35.1656 12.85481 17.1148 27.11591
Gene4 39.32014 28.463 39.8371 13.95959 19.56918 13.57346
Gene5 2.36461 3.088101 2.438246 0.083949 0.325994 0.073208
Gene6 67.2229 57.74836 64.43 41.06615 61.25952 67.94272
Gene7 29.82181 34.64335 32.97717 7.041322 8.776047 6.556024
Gene8 11.01882 12.65563 11.12888 1.538414 2.632991 2.211121
  • Class File(必ず必要)
    クラス分けファイルです。同一クラスのサンプル名が同一の色になるように塗り分けられます。

    このファイルは行列データであり、各列に各サンプル名が記載されており、2行目に各サンプルに対してクラスを割り当てます。なお1行目のサンプル名と Main File のサンプル名の名称が異なっても順番が同じであることを確認してください。
    下記の例で示されているようにクラスの指定は文字で振り分けることで、クラス毎に色が付けられます。ファイル名は半角英数字、ファイル内の文字は半角英数字、ファイルフォーマットは .tsv あるいは .csv にしてください。

    (例)
    Class File は以下の構成となります。
    1行目:サンプル名(A1~C3)
    2行目:クラス分け(文字を記載)。この場合、3つのクラスが形成されます。

A1 A2 A3 B1 B2 B3 C1 C2 C3
Class classA classA classA classB classB classB classC classC classC

4.9.2. パラメタ(オプション)

  • Exclude rows by normalized values
    Z-scoreに基づきクラスタリングに使用する遺伝子を選別することができます。
    初期設定は0です。
    値を大きくすることで、より変化量の大きい遺伝子のみでクラスタリングが行われます。

  • Exclude rows by raw values
    最大値に基づきクラスタリングに使用する遺伝子を選別することができます。
    初期設定は10です。
    値を大きくすることで、より発現量の大きい遺伝子のみでクラスタリングが行われます。

  • Graph Width (px)
    作成されたグラフの横幅(ピクセル)を表記しています。
    初期設定は800です。

  • Graph Height (px)
    作成されたグラフの縦幅(ピクセル)を表記しています。
    初期設定は600です。

  • Graph Image File Format
    作成したグラフの画像をダウンロードする際のファイル形式を選択します。
    json、png、jpeg から選択できます。
    png か jpeg を選択した場合は、静止画のグラフができます。
    jsonを選択した場合は、マウスドラグで操作することで自由に回転できるグラフができます。
    このグラフをダウンロードしたファイルもマウス操作できます。これを表示するためには、ダウンロード結果のフォルダの中の RotatableScatterplot.html をダブルクリックしてウェブブラウザ(Chrome)で開いてください。

4.9.3. グラフ作成の結果

  • Graph
    作成されたグラフが表示されます。
    上述のパラメタ設定でファイル形式に json を指定した場合は、マウスでクリックしてドラグすることで自由に動かすことのできるグラフが表示されます。
    操作は、右上に表示される画像オプションを使います。使い方は以下を参考にしてください。
    https://plotly.com/chart-studio-help/getting-to-know-the-plotly-modebar/

    メニューのカメラアイコンをクリックして、”Download plot as a png”をクリックすると、グラフを回転させた状態での静止画像をダウンロードできます。

0650d90e-4627-11ee-9234-061da1ef3444.png?ref=thumb

  • Empty Graph
    上記のグラフから文字・数字を消したものが表示されます。
    作成されたグラフの文字・数字の大きさやフォントを変えたい・不要な文字数字を消したい、など、グラフ内の文字・数字が目的に沿わない場合には、こちらに適宜、文字・数字を書き入れてご利用ください。

  • Main File
    Main File」で読み込んだファイルの内容の最初の20行が表示されます。
    ファイルが読み込まれていない場合は、デモデータの内容が表示されます。

  • Class File
    「Class File
    」で読み込んだファイルの内容の最初の20行が表示されます。
    ファイルが読み込まれていない場合は、デモデータの内容が表示されます。

  • Extracted Data
    オプション指定によりフィルタリングされたデータの内容の最初の20行が表示されます。

  • PC Matrix Data
    各種成分でマッピングしたときの値が表示されます。

  • PCA Summary
    Standard deviation(各主成分の標準偏差)、Proportion of variance(各主成分の寄与率)、Cumulative proportion(累積寄与率)を表示します。

00b0ecf0-4627-11ee-aea3-061da1ef3444.png?ref=thumb

(各表の横スクロールバーは表の最下部にあります。)



4.10. Correlation Matrix

Correlation(相関係数)は、2つの確率変数の間にある「線形な関係」の強弱を測る指標です。

レプリケイトのデータ間でどのくらいの相関があるかを評価することができます。
複数のサンプル間での相関係数と散布図を1つの図にまとめて表示します。

image49

4.10.1. 入力ファイル

入力ファイルのサンプルデータは、Correlation Matrix画面右上の SampleData ボタンからダウンロードできます。

  • Main File(必ず必要)
    グラフ作成の元になるデータのメインファイルです。

    行列データであって、各列が各サンプル、各行が各変数(多くの場合遺伝子)を示します。1列目は遺伝子名が並び、1行目はサンプル名が並びます。それ以外のすべてのデータは数値です。数値でないものがあった場合にはエラーになります。ファイル名は半角英数字、ファイル内の文字は半角英数字、ファイルフォーマットは .tsv あるいは .csv にしてください。

    メインファイルの例(一部分)
    Gene1 ~ Gene8 : 遺伝子名
    A1 ~ B3: サンプル名

GeneID A1 A2 A3 B1 B2 B3
Gene1 3.444981 2.649978 4.079322 0.798433 0.685373 0.879506
Gene2 40.6541 34.2083 50.3686 9.837679 12.13115 11.15724
Gene3 35.68358 28.39499 35.1656 12.85481 17.1148 27.11591
Gene4 39.32014 28.463 39.8371 13.95959 19.56918 13.57346
Gene5 2.36461 3.088101 2.438246 0.083949 0.325994 0.073208
Gene6 67.2229 57.74836 64.43 41.06615 61.25952 67.94272
Gene7 29.82181 34.64335 32.97717 7.041322 8.776047 6.556024
Gene8 11.01882 12.65563 11.12888 1.538414 2.632991 2.211121

4.10.2. オプション

  • Draw Regression Line
    散布図に回帰直線を作成するかを指定できます。
    初期設定ではオフになっています。

  • Use Logarithmic scale
    散布図を対数スケールで作成するかを指定できます。
    初期設定ではオフになっています。

  • Adjust font size to correlation
    相関の大きさに応じてフォントの大きさを変えるかを指定できます。
    初期設定ではオフになっています。

  • Filter data
    サンプルごとに発現量が上位または下位1%に当てはまる遺伝子を除外します。
    初期設定ではオンになっています。

  • Graph Width (px)
    作成されたグラフの横幅(ピクセル)を表記しています。
    初期設定は800です。

  • Graph Height (px)
    作成されたグラフの縦幅(ピクセル)を表記しています。
    初期設定は600です。

  • Graph Image File Format
    作成したグラフの画像をダウンロードする際のファイル形式を選択します。
    “png”, “jpeg”, “tiff”形式から選択できます。
    ただし、tiff形式の画像は、ダウンロードはできますが、この画面には表示はされません。

4.10.3. グラフ作成の結果

  • Graph
    複数サンプル間のデータの相関を示すグラフが表示されます。

  • Main File
    「Main File」で読み込んだファイルの内容の最初の20行が表示されます。
    ファイルが読み込まれていない場合は、デモデータの内容が表示されます。
    (横スクロールバーは表の最下部にあります。)


4.11. Volcano Plot

Volcano Plotは散布図の一種で、2つのデータセットで変動のある要素の有意性を可視化し、閾値の決定や要素の選別を行うために使用します。 1例として、2つの群でそれぞれ特異的に発現する遺伝子を選別するために、変動率(fold-change)を横軸、縦軸にどのくらい群間で有意な差であるかを示すp-valueをとる散布図を作成します。 Visualizationでは、縦軸 p-value(-log10表示)、横軸 fold-change(log2表示)を作成します。

image50

4.11.1. 入力ファイル

入力ファイルのサンプルデータは、Volcano Plot画面右上の SampleData ボタンからダウンロードできます。

  • Main File(必ず必要)
    グラフ作成の元になるデータのメインファイルです。
    このデータは二群の発現変動の特徴を表した行列データであり、図を表示させるために必須です。
    ファイル名は半角英数字、ファイル内の文字は半角英数字、ファイルフォーマットは .tsv あるいは .csv にしてください。

    メインファイルはDESeq2ソフトから得られるデータと同じで、以下の構成となっています。
    1行目:各列の数値データを表す特徴名(Volcano Plot、MA Plotに必要)
    1列目:GeneID-Ensembl 形式で表記された各遺伝子に割り当てられたID
    2列目:BaseMeanー正規化されたカウントの数値データ(MA Plotに必要)
    3列目:Log2FCー発現変動比の数値データ (Volcano Plot、MA Plotに必要)
     計算式: Log2FC=Log2(B群のx遺伝子のカウント)-Log2(A群のx遺伝子のカウント)
    4列目:lfcSEー標準誤差値
    5列目:statーT検定値
    6列目:p-valueー優位確率(Volcano Plotに必要)
    7列目:padjー多重比較による調整済みp-value
    8列目:chr〇〇ー該当する遺伝子が局在する〇〇番目の染色体
    9列目:startー染色体上、該当する遺伝子の開始地点
    10列目:endー染色体上、該当する遺伝子の終了地点
    11列目:strandー該当する遺伝子のストランド(+、ーの二択)
    12列目:gene_symー遺伝子名
    13列目:gene_typeー遺伝子種(protein codingータンパク質コード遺伝子、lincRNAー長鎖ノンコーディングRNA)
    14列目:Descriptionー遺伝子の説明文
    15列目:EntrezGeneIDーEntrez形式で表記された各遺伝子のID
    16列目:Cellular_Component_IDー該当する遺伝子の細胞の構成要素を示すID
    17列目:Cellular_Component_Termー該当する遺伝子の細胞の構成要素の説明文
    18列目:Molecular_Function_IDー該当する遺伝子の分子機能を示すID
    19列目:Molecular_Function_Termー該当する遺伝子の分子機能の説明文
    20列目:Biological_Process_IDー該当する遺伝子の生物学的プロセスを示すID
    21列目:Biological_Process_Termー該当する遺伝子の生物学的プロセスの説明文

  • Target Gene File(なくても良い)
    座標上、標的とした遺伝子の位置を表示させるためのデータファイルです。
    このファイルをアップロードし、かつ下記の Show Specified Genes パラメタをオンにすると、目的の遺伝子の位置が下記の Color of Target Genes (HEX) パラメタで指定された色でグラフに示されます。アップロードしない場合は、図は表示されますが、目的の遺伝子の位置は表示されません。

    このファイルは1列のみの行データで、1行目はヘッダー行で「Gene ID」と記載します。2行目以降はStable IDs(*)を記載します。Main FileとGene IDの遺伝子名が同じであることを確認してください。ファイル名は半角英数字、ファイル内の文字は半角英数字、ファイルフォーマットは .tsv あるいは .csv にしてください。
    *Stable IDsとは、Ensembl等のデータベースが指定する遺伝子に対するIDです。安定したIDは、ENS[種の接頭辞][特徴タイプの接頭辞][ユニークな11桁の数字]という形になっています。

    (例)
    1行目:ヘッダー行。GeneIDと記入する
    2行目以降:データベースに基づくStable IDs

GeneID
ENSMUSG00000000409
ENSMUSG00000000411
ENSMUSG00000000416
ENSMUSG00000000420
ENSMUSG00000000435
ENSMUSG00000000439
ENSMUSG00000000440
ENSMUSG00000000441
ENSMUSG00000001666
・・・

遺伝子リストファイルをダウンロードできます。
[https://rias.rhelixa.com/csv/visualization/gene_symbol_list_file_example.csv]

4.11.2. オプション

  • Show Target Genes
    「Target Gene File」で指定したファイルに含まれる遺伝子をマーキングすることができます。
    初期設定はオンです。

  • Use Adjusted p-value for Threshold
    Adjusted p-valueの列が存在する場合は、p-valueの代わりにAdjusted p-valueを縦軸にとることができます。
    初期設定はオンです。

  • Color of Non-significant Genes (HEX)
    有意な変動のない要素の色を16進数で指定します。
    例えばblackの場合は「000000」、redの場合は「ff0000」を指定してください。
    16進数での色の指定の仕方はこちらを参考にしてください。
    https://www.colordic.org/

  • Color of Negatively Significant Genes (HEX)
    負に有意な変動のある要素の色を16進数で指定します。

  • Color of Positively Significant Genes (HEX)
    正に有意な変動のある要素の色を16進数で指定します。

  • Color of Target Genes (HEX)
    「Target Gene File」で指定したファイルに含まれる遺伝子について、マーキングする色を16進数で指定します。

  • Threshold for Log2 Fold Change Values
    有意判定をするFold changeの閾値を定めます。
    初期設定は1.0です。
    値を大きくすることで、グループ間でより変動のある遺伝子を絞り込めます。

  • Threshold for p-value
    p-value の閾値を定めます。有意判定をするための
    初期設定は0.05です。
    値を小さくすることで、グループ間でばらつきの少ない遺伝子を絞り込めます。

  • Graph Width (px)
    作成されたグラフの横幅(ピクセル)を表記しています。
    初期設定は800です。

  • Graph Height (px)
    作成されたグラフの縦幅(ピクセル)を表記しています。
    初期設定は600です。

  • Graph Image File Format
    作成したグラフの画像をダウンロードする際のファイル形式を選択します。
    json、png、jpeg から選択できます。
    png か jpeg を選択した場合は、静止画のグラフができます。
    jsonを選択した場合は、マウスドラグで操作することで自由に動かせるグラフができます。このグラフをダウンロードしたファイルもマウス操作できます。これを表示するためには、ダウンロード結果のフォルダの中の Volcanoplot.html をダブルクリックしてウェブブラウザ(Chrome)で開いてください。

4.11.3. グラフ作成の結果

  • Graph
    作成されたグラフが表示されます。
    上述のパラメタ設定でファイル形式に json を指定した場合は、マウスでクリックしてドラグすることで自由に動かすことのできるグラフが表示されます。
    グラフを動かした状態での静止画像をダウンロードすることもできます。操作は、右上に表示される画像オプションを使います。その内容と使い方は以下を参考にしてください。
    https://plotly.com/chart-studio-help/getting-to-know-the-plotly-modebar/

    メニューのカメラアイコンをクリックして、”Download plot as a png”をクリックすると、グラフを動かした状態での静止画像をダウンロードできます。

  • Empty Graph
    上記のグラフから文字・数字を消したものが表示されます。
    作成されたグラフの文字・数字の大きさやフォントを変えたい・不要な文字数字を消したい、など、グラフ内の文字・数字が目的に沿わない場合には、こちらに適宜、文字・数字を書き入れてご利用ください。

  • Main File
    「Main File」で読み込んだファイルの内容の最初の行が表示されます。
    ファイルが読み込まれていない場合は、デモデータの内容が表示されます。

  • Target Genes File
    「Target Genes File」で読み込んだファイルの内容の最初の20行が表示されます。
    ファイルが読み込まれていない場合は、デモデータの内容が表示されます。

  • Target Genes Summary
    Raw Dataのうち、「Target Gene File」で指定したファイルに含まれる遺伝子について内容を出力します。

    (各表の横スクロールバーは表の最下部にあります。)


4.12. MA Plot

MA Plot(M (log ratio) / A (mean average))はVolcano Plotと同様に、2つのデータセットで変動のある要素の有意性を可視化し、閾値の決定や要素の選別を行うために使用します。
 
Volcano Plotと異なる点として、MAプロットでは絶対量(例えば発現量)と fold change の散布図を作成します。Visualizationでは、縦軸に fold-change(log2表示)、横軸に絶対量(log10表示)を作成します。

image51

4.12.1. 入力ファイル

入力ファイルのサンプルデータは、MA Plot画面右上の SampleData ボタンからダウンロードできます。

  • Main File(必ず必要)
    グラフ作成の元になるデータのメインファイルです。
    ファイルフォーマットは、.tsv あるいは .csv にしてください。このデータは二群の発現変動の特徴を表した行列データであり、図を表示させるために必須です。ファイル名は半角英数字、ファイル内の文字は半角英数字、ファイルフォーマットは .tsv あるいは .csv にしてください。

    メインファイルはDESeq2ソフトから得られるデータと一緒であり、以下の構成になっています。
    1行目:各列の数値データを表す特徴名(Volcano Plot、MA Plotに必要)
    1列目:GeneIDーEnsembl形式で表記された各遺伝子に割り当てられたID
    2列目:BaseMeanー正規化されたカウントの数値データ(MA Plotに必要)
    3列目:Log2FCー発現変動比の数値データ (Volcano Plot、MA Plotに必要)
     計算式:Log2FC=Log2(B群のx遺伝子のカウント)-Log2(A群のx遺伝子のカウント)
    4列目:lfcSEー標準誤差値
    5列目:statーT検定値
    6列目:p-valueー優位確率(Volcano Plotに必要)
    7列目:padjー多重比較による調整済みp-value
    8列目:chr〇〇ー該当する遺伝子が局在する〇〇番目の染色体
    9列目:startー染色体上、該当する遺伝子の開始地点
    10列目:endー染色体上、該当する遺伝子の終了地点
    11列目:strandー該当する遺伝子のストランド(+、ーの二択)
    12列目:gene_symー遺伝子名
    13列目:gene_typeー遺伝子種(protein codingータンパク質コード遺伝子、lincRNAー長鎖ノンコーディングRNA)
    14列目:Descriptionー遺伝子の説明文
    15列目:EntrezGeneIDーEntrez形式で表記された各遺伝子のID
    16列目:Cellular_Component_IDー該当する遺伝子の細胞の構成要素を示すID
    17列目:Cellular_Component_Termー該当する遺伝子の細胞の構成要素の説明文
    18列目:Molecular_Function_IDー該当する遺伝子の分子機能を示すID
    19列目:Molecular_Function_Termー該当する遺伝子の分子機能の説明文
    20列目:Biological_Process_IDー該当する遺伝子の生物学的プロセスを示すID
    21列目:Biological_Process_Termー該当する遺伝子の生物学的プロセスの説明文

  • Target Genes File(なくても良い)
    座標上、標的とした遺伝子の位置を表示させるためのデータファイルです。
    このファイルをアップロードし、かつ下記の**Show Specified Genesパラメタをオンにすると、目的の遺伝子の位置が下記のColor of Target Genes (HEX)**パラメタで指定された色でグラフに示されます。アップロードしない場合は、図は表示されますが、目的の遺伝子の位置は表示されません。

    このファイルは1列のみの行データで、1行目はヘッダー行で「Gene ID」と記載します。2行目以降はStable IDs(*)を記載します。Main FileとGene IDの遺伝子名が同じであることを確認してください。ファイルフォーマットは、.tsv あるいは .csv にしてください。
    *Stable IDsとは、Ensembl等のデータベースが指定する遺伝子に対するIDです。安定したIDは、ENS[種の接頭辞][特徴タイプの接頭辞][ユニークな11桁の数字]という形になっています。
    ファイル名は半角英数字、ファイル内の文字は半角英数字、ファイルフォーマットは .tsv あるいは .csv にしてください。

    (例)
    1行目:ヘッダー行。GeneIDと記入する
    2行目以降:データベースに基づくStable IDs

GeneID
ENSMUSG00000000409
ENSMUSG00000000411
ENSMUSG00000000416
ENSMUSG00000000420
ENSMUSG00000000435
ENSMUSG00000000439
ENSMUSG00000000440
ENSMUSG00000000441
ENSMUSG00000001666
・・・

4.12.2. パラメタ(オプション)

  • Show Target Genes
    Target Genes File」で指定したファイルに含まれる遺伝子をマーキングすることができます。
    初期設定はオンです。

  • Use Adjusted p-value for Threshold
    Adjusted p-valueの列が存在する場合は、p-valueの代わりにAdjusted p-valueを縦軸にとることができます。
    初期設定はオンです。

  • Color of Non-significant Genes (HEX)
    有意な変動のない要素の色を16進数で指定します。
    例えばblackの場合は「000000」、redの場合は「ff0000」を指定してください。
    16進数での色の指定の仕方はこちらを参考にしてください。
    https://www.colordic.org/

  • Color of Negatively Significant Genes (HEX)
    負に有意な変動のある要素の色を16進数で指定します。

  • Color of Positively Significant Genes (HEX)
    正に有意な変動のある要素の色を16進数で指定します。

  • Color of Target Genes (HEX)
    「Target Genes File」で指定したファイルに含まれる遺伝子について、マーキングする色を16進数で指定します。

  • Threshold for Log2 Fold Change Value
    有意判定をするFold changeの閾値を定めます。
    初期設定は 1.0 です。
    値を大きくすることで、グループ間でより変動のある遺伝子を絞り込めます。

  • Threshold for p-value
    有意判定をする P-valueの閾値を定めます。
    初期設定は0.05です。
    値を小さくすることで、グループ間でばらつきの少ない遺伝子を絞り込めます。

  • Graph Width (px)
    作成されたグラフの横幅(ピクセル)を表記しています。
    初期設定は800です。

  • Graph Height (px)
    作成されたグラフの縦幅(ピクセル)を表記しています。
    初期設定は600です。

  • Graph Image File Format
    作成したグラフの画像をダウンロードする際のファイル形式を選択します。
    json、png、jpeg から選択できます。
    png か jpeg を選択した場合は、静止画のグラフができます。jsonを選択した場合は、マウスドラグで操作することで自由に動かせるグラフができます。このグラフをダウンロードしたファイルもマウス操作できます。これを表示するためには、ダウンロード結果のフォルダの中の MAplot.html をダブルクリックしてウェブブラウザ(Chrome)で開いてください。


4.13. Chord Diagram

Chord Diagramは、データセットに含まれる要素間の相互作用や関係性を直感的かつ網羅的に理解するのに役立ちます。視覚的な表現によって、データのパターンや傾向を素早く把握できます。要素間の関係や接続を視覚的に表現するための情報可視化手法の一つです。

本モジュールでは、各サンプルは円周に等間隔に配置され、サンプル間の結びつきおよびその強度が弧として描かれます。 相関係数を指標にサンプル間の類似性を評価し、類似性が高いサンプルほど、より太い弧で接続されます。

08536e56-4627-11ee-a56e-061da1ef3444.png?ref=thumb


4.13.1. 入力ファイル

入力ファイルのサンプルデータは、Chord Diagram画面右上のSampleDataボタンからダウンロードできます。

  • Main File(必ず必要)
    グラフ作成の元になるデータのメインファイルです。
    2つのタイプの行列を入力することができます。
    一つ目:行列データであって、各列が各サンプル、各行が各変数(多くの場合遺伝子)を示します。1列目は遺伝子名が並び、1行目はサンプル名が並びます。それ以外のすべてのデータは数値です。数値でないものがあった場合にはエラーになります。ファイル名は半角英数字、ファイル内の文字は半角英数字、ファイルフォーマットは .tsv あるいは .csv にしてください。

    メインファイルの例(データが相関係数でない場合)
    Gene1 ~ Gene8 : 遺伝子名
    A1 ~ B3: サンプル名

GeneID A1 A2 A3 B1 B2 B3
Gene1 3.444981 2.649978 4.079322 0.798433 0.685373 0.598215
Gene2 40.6541 34.2083 50.3686 9.837679 12.13115 11.15724
Gene3 35.68358 28.39499 35.1656 12.85481 17.1148 27.11591
Gene4 39.32014 28.463 39.8371 13.95959 19.56918 13.57346
Gene5 2.36461 3.088101 2.438246 0.083949 0.325994 0.073208
Gene6 67.2229 57.74836 64.43 41.06615 61.25952 67.94272
Gene7 29.82181 34.64335 32.97717 7.041322 8.776047 6.556024
Gene8 11.01882 12.65563 11.12888 1.538414 2.632991 2.211121
二つ目:相関マトリックスであり、各マスには、それぞれの行と列の相関係数が記述されています。1列目と1行目にはサンプル名または遺伝子名が並びます。それ以外のすべてのデータは数値です。数値でないものがあった場合にはエラーになります。ファイル名は半角英数字、ファイル内の文字は半角英数字、ファイルフォーマットは .tsv あるいは .csv にしてください。

メインファイルの例(データが相関係数の場合)

A1 ~ B3: サンプル名

GeneID A1 A2 A3 B1 B2 B3
A1 1 0.264997 0.407932 0.798433 0.685373 0.598215
A2 0.264997 1 0.503686 0.983779 0.121315 0.111572
A3 0.407932 0.503686 1 0.185481 0.711480 0.271191
B1 0.798433 0.983779 0.185481 1 0.56918 0.57346
B2 0.685373 0.121315 0.711480 0.083949 1 0.073208
B3 0.598215 0.111572 0.271191 0.57346 0.073208 1

4.13.2. パラメタ

  • Main File is Correlation Matrix
    メインファイルが相関行列であるかどうかを選択します。
    初期設定はオンです。

  • Exclude rows (genes) by normalized values
    Z-scoreに基づきクラスタリングに使用する遺伝子を選別することができます。
    初期設定は0.0です。
    値を大きくすることで、より変化量の大きい遺伝子のみでクラスタリングを行うことができます。

  • Exclude rows (genes) by raw values
    最大値に基づきクラスタリングに使用する遺伝子を選別することができます。
    初期設定は100.0です。
    値を大きくすることで、より発現量の大きい遺伝子のみでクラスタリングが行われます。

  • Graph Width(px)
    作成されたグラフの横幅(ピクセル)を表記しています。
    初期設定は800です。

  • Graph Height(px)
    作成されたグラフの縦幅(ピクセル)を表記しています。
    初期設定は600です。

  • Graph Image File Format
    作成したグラフの画像をダウンロードする際のファイル形式を選択します。
    “png”, “jpeg”, “tiff”形式から選択できます。ただし、tiff形式の画像は、ダウンロードはできますが、この画面には表示はされません。

4.13.3. グラフ作成の結果

  • Graph
    作成されたグラフが表示されます。

  • Main File
    「Main File」で読み込んだファイルの内容の最初の20行が表示されます。
    ファイルが読み込まれていない場合は、デモデータの内容が表示されます。

  • Correlation Matrix
    Main File is Correlation Matrixがオフの場合に表示されます。
    メインファイルから作成される相関行列が表示されます。

  • Extracted Data
    Main File is Correlation Matrixがオフの場合に表示されます。
    オプション指定でフィルタリングされたデータの内容の最初の20行が表示されます。

  (各表の横スクロールバーは表の最下部にあります。)


4.14. Network Analysis

Network Analysis では頂点とそれらをつなぐ辺で構成されたネットワークを作成し、頂点同士の関係を表現するものです。このモジュールでは、主に遺伝子・サンプル間の相関係数の強さを頂点をつなぐ辺として表現し、それぞれの遺伝子・サンプルがどのような関係にあるのかを解析します。

image51

4.14.1. 入力ファイル

入力ファイルのサンプルデータは、Network Analysis画面右上の SampleData ボタンからダウンロードできます。

  • Main File(必ず必要)
    グラフ作成の元になるデータのメインファイルです。
    2つのタイプの行列を入力することができます。
    一つ目:行列データであって、各列が各サンプル、各行が各変数(多くの場合遺伝子)を示します。1列目は遺伝子名が並び、1行目はサンプル名が並びます。それ以外のすべてのデータは数値です。数値でないものがあった場合にはエラーになります。ファイル名は半角英数字、ファイル内の文字は半角英数字、ファイルフォーマットは .tsv あるいは .csv にしてください。

    メインファイルの例(データが相関係数でない場合)
    Gene1 ~ Gene8 : 遺伝子名
    A1 ~ B3: サンプル名

GeneID A1 A2 A3 B1 B2 B3
Gene1 3.444981 2.649978 4.079322 0.798433 0.685373 0.598215
Gene2 40.6541 34.2083 50.3686 9.837679 12.13115 11.15724
Gene3 35.68358 28.39499 35.1656 12.85481 17.1148 27.11591
Gene4 39.32014 28.463 39.8371 13.95959 19.56918 13.57346
Gene5 2.36461 3.088101 2.438246 0.083949 0.325994 0.073208
Gene6 67.2229 57.74836 64.43 41.06615 61.25952 67.94272
Gene7 29.82181 34.64335 32.97717 7.041322 8.776047 6.556024
Gene8 11.01882 12.65563 11.12888 1.538414 2.632991 2.211121
二つ目:相関マトリックスであり、各マスには、それぞれの行と列の相関係数が記述されています。1列目と1行目にはサンプル名または遺伝子名が並びます。それ以外のすべてのデータは数値です。数値でないものがあった場合にはエラーになります。ファイル名は半角英数字、ファイル内の文字は半角英数字、ファイルフォーマットは .tsv あるいは .csv にしてください。

メインファイルの例(データが相関係数の場合)

A1 ~ B3: サンプル名

GeneID A1 A2 A3 B1 B2 B3
A1 1 0.264997 0.407932 0.798433 0.685373 0.598215
A2 0.264997 1 0.503686 0.983779 0.121315 0.111572
A3 0.407932 0.503686 1 0.185481 0.711480 0.271191
B1 0.798433 0.983779 0.185481 1 0.56918 0.57346
B2 0.685373 0.121315 0.711480 0.083949 1 0.073208
B3 0.598215 0.111572 0.271191 0.57346 0.073208 1
  • Node Labeling File (for only correlation matrix)
    メインファイルが「correlation matrix」の場合にのみ使用可能なオプションです。表示される頂点のうち、特定の頂点を目立つように手動で選択し描画したい場合は、このファイルをアップロードしてください。このファイルは、1列目は遺伝子またはサンプル名が並び、2列目はそれぞれの頂点が表示されるかどうかを決定する値(ハイライトする場合は1、ハイライトしない場合は0)が並びます。
    ファイル名は半角英数字、ファイル内の文字は半角英数字、ファイルフォーマットは .tsv あるいは .csv にしてください。
    (例)
    1行目:ヘッダー行。GeneIDと記入する
    2行目以降:データベースに基づくStable IDs
SampleID Show Node
A1 0
A2 1
A3 1
B1 1
B2 0
B3 1
・・・ ・・・
  • Gene Symbol File(なくても良い)
    メインファイルのデータの各行のうち、このファイルに存在する遺伝子名(行名)の行のみを使ってグラフ作成を行います。一列のみの遺伝子名(行名)リストの行列ファイルです。
    このファイルが無い場合にはリストが表示されません。
    ファイル名は半角英数字、ファイル内の文字は半角英数字、ファイルフォーマットは .tsv あるいは .csv にしてください。
    (例)
    Gene Symbol Fileは以下の構成になっています。
    1行目:Gene_Symbol
    2行目以降:該当する遺伝子名(gene symbolで記載)
Gene_Symbol
TSPAN6
TNMD
DPM1
SCYL3
C1orf112
FGR
CFH
FUCA2
GCLC
・ ・ ・
このファイルを作成するには、Microsoft Excel などを使う方法と、このRIAS Visualization に含まれているツール Gene Selection Tool を使う方法があります。 Gene Selection Tool を使うと、Gene Ontrogy Term を利用しての高度な遺伝子指定ができます。 Gene Selection Tool を起動するには、「Gene Symbol File (Optional) Gene Selection Tool」の部分をクリックしてください。Gene Selection Tool 」の右側にある「がウェブブラウザの隣のタブに表示されます。

4.14.2. パラメタ(オプション)

  • Exclude rows (genes) by normalized values
    |z-score| < (指定値) となる遺伝子を解析・描画の対象から除くことができます。
    初期設定は0です。
    値を大きくすることでサンプル間での変化量の大きい遺伝子のみが選別されます。
    例えば指定値が2のとき、全サンプルが2σ区間から出ない遺伝子は発現量に大きな差がないと見なされ、対象から除かれることになります。

  • Exclude rows (genes) by raw values
    いずれのサンプルでも指定値を超えない遺伝子について、解析・描画の対象から除くことができます。
    初期設定は100です。
    値を大きくすることで、発現量の大きい遺伝子のみが選別されます。

  • Color of Negative Edge Values (HEX)
    Main File」から計算された相関係数が負の場合、辺の色がこの色で描画されます。
    初期設定は#00688b(青)です。

  • Color of Positive Edge Values (HEX)
    Main File」から計算された相関係数が正の場合、辺の色がこの色で描画されます。
    初期設定は#ee0000(赤)です。

  • Color of Nodes (HEX)
    描画される頂点の色がこの色で描画されます。
    初期設定は#7f7f7f(灰色)です。

  • Color of Targets (HEX)
    Node Labeling File (for only correlation matrix)」で指定された頂点のみが、描画される際にこの色で描画されます。
    初期設定は#ff6347(赤)です。

  • Threshold for Edge Weights
    相関行列に含まれる値のうち、絶対値がこの値よりも大きい相関を持つ辺のみを選択して描画します。相関係数の絶対値は0〜1の間の値を取るので、この範囲を超えた値を入力した場合はエラーが生じます。
    初期設定は0.7です。

  • Graph Width (px)
    作成されたグラフの横幅(ピクセル)を表記しています。
    初期設定は800です。

  • Graph Height (px)
    作成されたグラフの縦幅(ピクセル)を表記しています。
    初期設定は600です。

  • Community Detection Methods
    ネットワークグラフから、クラスタリング(Community Detection)を行う際のアルゴリズムを選択します。
    以下の3種から選択できます。

    • Edge Betweenness
    • Label Property
    • Fast Greedy
  • Network Layouts
    ネットワークグラフの頂点を配置する方法を選択します。このパラメタはネットワークの見た目を左右するもので、最終的な計算に影響はありません。
    以下の16種から選択できます。

    • ALL(test)
    • Star
    • Components
    • Circle
    • Nicely
    • Grid
    • Sphere
    • Random
    • Davidson-Harel
    • DrL
    • Fruchterman-Reingold
    • GEM
    • GraphOpt
    • Kamada & Kawai
    • Large Graph Layout
    • Multidimensional Scaling
  • Graph Image File Format
    作成したグラフの画像をダウンロードする際のファイル形式を選択します。
    json、png、jpeg から選択できます。

4.14.3. グラフ作成の結果

  • Graph
    作成されたグラフが表示されます。

  • Blank Graph
    上記のグラフから文字・数字を消したものが表示されます。

  • Main File
    Main File」で読み込んだファイルの内容の最初の20行が表示されます。
    ファイルが読み込まれていない場合は、デモデータの内容が表示されます。

  • Correlation Matrix
    Main File」で読み込んだファイルが相関係数でなかった場合、内部で計算された相関係数の行列の最初の20行が表示されます。
    ファイルが読み込まれていない場合は、デモデータの内容が表示されます。

  • Dendrogram Plot
    ネットワークグラフより推定された、クラスターを系統樹として表した図です。
    ファイルが読み込まれていない場合は、デモデータの内容が表示されます。もし、「Threshold for Edge Weights」によって全ての辺が削除されてしまった場合、クラスタリングを行うことができないため、このグラフは表示されません。「Threshold for Edge Weights」を低くして再度実行してください。
    ファイルが読み込まれていない場合は、デモデータの内容が表示されます。

  • Community Graph
    ネットワークグラフより推定された、クラスターを元のネットワークグラフに色付けして表した図です。
    ファイルが読み込まれていない場合は、デモデータの内容が表示されます。もし、「Threshold for Edge Weights」によって全ての辺が削除されてしまった場合、クラスタリングを行うことができないため、このグラフは表示されません。「Threshold for Edge Weights」を低くして再度実行してください。
    ファイルが読み込まれていない場合は、デモデータの内容が表示されます。

  • Gene Symbol File
    「Gene Symbol File」で読み込んだファイルの内容の最初の20行が表示されます。
    ファイルが読み込まれていない場合は、デモデータの内容が表示されます。

    (各表の横スクロールバーは表の最下部にあります。)



5. 付録:Heatmapの操作の詳細説明

ここでは、Visualization で作成できるグラフ(可視化方式)のうちの「Heatmap」のグラフ作成の操作の実際をご説明いたします。

5.1. ファイルを用意する

最初に、以下のファイルを手元PCに用意します。 Heatmap画面右上の SampleData ボタンからサンプルデータのファイルをダウンロードできます。

  • メインファイル (必ず必要)
  • 補助データファイル
    ・Class File (無くても良い)
    ・Gene Symbol File (無くても良い)

5.1.1. メインファイル

メインファイルは作成するグラフの元データとなるファイルです。必ず必要です。
ファイル名は半角英数字、ファイル内の文字は半角英数字、ファイルフォーマットは CSV形式(カンマ区切りのテキスト)またはTSV形式(タブ区切りのテキスト)です。
(※弊社RNA-seqデータ解析付きサービスをご依頼のお客様は、納品データ中の"RIAS"フォルダにあります)

各列が各サンプル、各行が各変数(遺伝子名・数値)です。1列目は遺伝子名が並び、1行目はサンプル名が並びます。それ以外のすべてのデータは数値です。数値でないものがあった場合にはエラーになります。

サンプルデータは、Heatmap画面右上の SampleData ボタンからダウンロードできます。

メインファイルの例(一部分)
Gene1 ~ Gene8 : 遺伝子名
Control1 ~ Treated_X_3 : サンプル名

GeneID Control1 Control2 Control3 Treated_X_1 Treated_X_2 Treated_X_3
Gene1 3.444981 2.649978 4.079322 0.798433 0.685373 0.879506
Gene2 40.6541 34.2083 50.3686 9.837679 12.13115 11.15724
Gene3 35.68358 28.39499 35.1656 12.85481 17.1148 27.11591
Gene4 39.32014 28.463 39.8371 13.95959 19.56918 13.57346
Gene5 2.36461 3.088101 2.438246 0.083949 0.325994 0.073208
Gene6 67.2229 57.74836 64.43 41.06615 61.25952 67.94272
Gene7 29.82181 34.64335 32.97717 7.041322 8.776047 6.556024
Gene8 11.01882 12.65563 11.12888 1.538414 2.632991 2.211121

5.1.2. 補助データファイル Class File の作成

Class Fileは、どのサンプルがどのグループ(クラス)に属するかを指定するファイルです。Heatmap では、このファイルがあればグラフでの上記のグループ(クラス)ごとの色分けを指定できます。
このファイルが無い場合には、標準的な色分けになります。

以下の手順で作成してください。

1. Microsoft Excelを起動
手元のPCでMicrosoft Excel (あるいはGoogle Spread Sheet など)を起動し、新規の空白のブックを開きます。

2. データを入力
1行目にサンプル名を並べて記入してください。この1行目は、メインファイルの1行目と同じにしてください。ただしA1は空欄にしてください。
2行目にはクラス名を記入してください。ただしA2は「Class」と記入してください。
ファイル内の文字は半角英数字にしてください。
image52

3. ファイルを保存
ファイルを保存するために、左上の「ファイル」から「名前を付けて保存...」を選択してください。ファイル名は半角英数字にしてください。

image53

4. ファイルを保存(続き)
希望するファイル名(半角英数字)を記入し、ファイル形式はcsv(コンマ区切り)を選択し、「保存」をクリックしてください。これで保存したファイルが Class File になり、Heatmap の補助ファイルとして入力して使うことになります。

image54

5. 終了
ファイル保存が完了したら、Microsoft Excelを終了してください。


5.2. サインインして、Visualization を起動し、Heatmap 画面を表示させる

  1. ウェブブラウザでRIASのURL(https://rias.rhelixa.com/ )にアクセスしてください。
    ユーザーごとに発行されたユーザー名とパスワードを入力し、「Sign in」をクリックしてください。アクセスに成功すれば、サインイン画面が表示されます。

image2

2. 初期パスワードからの変更や、パスワードが分からなくなったなどの場合は、下記の方法で新しいパスワードへ変更してください。

  1. ログイン画面下段の”Forget your password?”をクリックしてください。
  2. お客様のE-mail addressを入力してください。
  3. ”Send me reset password instructions”ボタンをクリックしてください。
  4. ”[RIAS] Reset password instructions”というタイトルのメールが届きますので、”Change my password”から
    新しいパスワードを入力し、パスワードを変更してください。
  5. サインインに成功すると、Rhellixa の「Rhelixaサービスのトップ画面」が表示されます。この中から「RIAS」をクリックしてください。
  6. 「RIASのトップ画面」が表示されます。この中から「Visualization」をクリックしてください。
  7. 「Visualizationのトップ画面」が表示されます。利用できる可視化手法のサンプル図が並んでいます。
  8. その中から「Heatmap」の図をクリックすれば Heatmap の画面が表示されます。

図 「Visualizationのトップ画面」
3e43c66c-5e98-11ee-9506-064017533d40.png?ref=thumb
07603024-4627-11ee-b86b-061da1ef3444.png?ref=thumb
08d1d962-4627-11ee-a5e8-061da1ef3444.png?ref=thumb

5.3. Gene Symbol File の作成

補助ファイル Gene Symbol Fileは、指定した遺伝子の発現パターンのみを表示したい場合に作成します。Gene Symbol File を指定しない場合には、すべての遺伝子の発現パターンがグラフに表示されます。
 
GOとはすべての生物 種の遺伝子とその機能を統一的に表現するために作られたプロジェクト(http://geneontology.org/)であり、GO termは遺伝子の機能に関する概念の一つ一つについて割り振られた用語です。

主要な生物種に関して、遺伝子ID が GO term と関連付けられており、現在も継続的に更新されています。
GO term は以下3つのカテゴリー分かれており、発現変動遺伝子がもたらす細胞や組織への影響を包括的に評価するために用いられます。

  • Cellular Component:細胞の構造や構成を示します。標的とする遺伝子が局在する 場所(オルガネラなど)の情報を挙げます。

  • Molecular Function:分子そのものの機能を示します。「触媒作用」や「輸送」など、分子レベルで起こる一般的な活動を表しており、領域や時間要素などの特異性はありません。

  • 生物学的プロセス(Biological Processes):細胞や組織レベルでの役割を示します。複合体や複数の分子による活動を表すこともあるが、具体的なパスウェイについては触れません。

    Gene Symbol File を作成するには、以下の2つの方法があります。いずれかの方法をお使いください。

    1. Microsoft Excelを使って、すべて最初から Gene Symbol File を作成する方法

    2. 本システム RIAS Visualization の中に組み込まれているツール「Gene Selection Tool」を使って、Go List File を読み込ませて Gene Symbol File を作成する方法

    Gene Selection Tool を使うと、Gene Onotology (GO) List File を元にして、特定の GO term を持つ遺伝子のみを Visualization の Heatmap に反映させるような Gene Symbol File を作成できます。


5.3.1. Microsoft Excel を使う方法

この方法では、解析結果に関連した Gene List File (Annotation_RIAS.csv など)は使わずに、 Microsoft Excel を使って全て最初から Gene Symbol File を作成します。

1. Microsoft Excel を起動
手元の PC で Microsoft Excel (あるいはGoogle Spread Sheet など)を起動し、新規の空白のブックを開いてください。

2. データを入力
1行目には、「Gene Symbol」というヘッダー名を記載してください。
2行目以降には、グラフに表示させたい遺伝子名(gene symbol)を記載してください。
※Main File に載っていない遺伝子は、記載しても表示されません。
 ファイル内の文字は半角英数字にしてください。

019934c4-4627-11ee-b608-061da1ef3444.png?ref=thumb

3. ファイルを保存
手元PCの適切なフォルダへファイルを保存するために、左上の「ファイル」から「名前付けて保存...」を選択してください。

01c1d794-4627-11ee-96bd-061da1ef3444.png?ref=thumb

4. ファイルを保存(続き)
希望するファイル名(半角英数字)を記入し、ファイル形式はcsv(コンマ区切り)を選択し、「保存」をクリックしてください。これで保存したファイルが Gene Symbol File になり、Heatmap の補助ファイルとして、MyDataへアップロードしてから 使うことになります。

image57

5. 終了
Microsoft Excel を終了してください。



5.3.2. Gene Selection Tool を使う方法

本システム RIAS Visualization に組み込まれているツール「Gene Selection Tool」を使って、Gene Symbol File を作成する方法です。Gene Selection Tool は、Heatmap描画機能において特定の生物学的機能に関わる遺伝子を絞り込み、特定の遺伝子のみでヒートマップを作成するためのサポートツールです。

以下に、Rhelixa の RNA-seq スタンダード解析(DEG解析)サービスの納品データを使用した場合の手順について説明します。

Rhelixaの RNA-seq 解析サービスの解析結果の納品データと共に、Visualization で使う解析結果「メインファイル」に関連した Gene List File を Annotation_RIAS.csv というファイル名でご提供しています。

1. 「GO List File」データをMyDataへアップロード

お手元のPCに用意した Annotation_RIAS.csv を MyData へアップロードします。

1-1. MyData ページへ移動
画面右上の「MyDataボタン」 をクリックしてください。
ブラウザに新しいタブが開き、これまでにアップロードされたファイルの一覧が確認できます。
70ab78d4-5e98-11ee-9e5c-061da1ef3444.png?ref=thumb

1-2. MyData へファイルをアップロード
MyData へファイルをアップロードするために、まず画面左の「Add」をクリックしてください。

image59

1-3. MyData へファイルをアップロード(続き)
MyData領域へアップロードする Annotation_RIAS.csv を手元PCの中から選択するため、まずファイルアイコンをクリックしてください。

image60

1-4. MyData へファイルをアップロード(続き)
まずはメインファイルを選択し「開く」をクリックします。

image61

1-5. MyData へファイルをアップロード(続き)
Annotation_RIAS.csv を選択するため、左下のアイコンをクリックし、ファイルを選択します。

image62

1-6. MyData へファイルをアップロード(続き)
手元PC から MyData 領域へアップロードしたいファイルを選択したら、「Upload To Mydata」をクリックしてください。

image63

1-7. アップロード結果を確認
アップロードしたファイルが MyData の一覧リストに載っていることを確認してください。
ブラウザの元のタブを開いて、元の画面に戻ってください。

image64

2. 「Gene Selection Tool」を起動

Heatmap の画面で「Gene Symbol File (Optional)」の右側にある「use Gene Selection Tool」の部分をクリックしてください。ウェブブラウザの隣のタブに Setting: Gene Selection Tool が起動します。

image65

3. 「Gene List File」データをMyDataからGene Selection Toolへ読み込む

MyData にアップロードした Annotation_RIAS.csv を Gene Selection Tool へ読み込ませます。

3-1. Gene List Fileを指定
Gene List Fileを指定するために「Open」をクリックしてください。

image66

3-2. Gene List Fileを指定(続き)
MyDataの一覧「Files」が表示されますので、先ほどアップロードした Annotation_RIAS.csv の右端にある「Select」をクリックし、「Apply」をクリックしてください。
しばらくすると、Gene Selection Tool に読み込みが完了し、その内容の GO Term が表示されます。(少々時間がかかることがあります。)

image67

4. GO termを選択
画面に GO Term が、Cellular Component・Molecular Function・Biological Process の3つに分かれて表示されます。(下図参照)

この GO Term から対象とするものを選択してゆくと、対応する遺伝子が見つけ出されて、右側の「Output Genes」の下に現れます。 見つけ出された遺伝子の数は「Output Genes」の右側に表示されます。 選択をやりやすくするために、Search や AND/OR などの機能が用意されています。

image68

4-1. GO Term を選択する方法について
GO Term は以下の3つに分けて表示されています。RhelixaのRNA-seqサービスで作成された Annotation_RIAS.tsv を使用される場合、以下の区分で GO Term が表示されます。

  • Cellular Component: 細胞中の何を構成している分子か
  • Molecular Function: どのような種類の分子であるか
  • Biological Process : どのような生物学的機能に関わるか

image69

使用例
まず、Filter の行で「Show all terms」をクリックしてオンにしてください。この状態で、最初に読み込んだファイルに含まれる全ての GO Term が表示されています。
Gene Filter: で「OR」をクリックしてオンにしてください。

この中の必要な GO Term (いくつでも)にチェックを入れてください。
この状態でFilter の行で「Show only selected terms」をクリックしてオンにすると、チェックを入れてある GO Term のみが表示されます。
また、「Show only unselected terms」をクリックしてオンにすると、チェックを入れてない GO Term のみが表示されます。

また、それぞれの GO Term に関連づけられた遺伝子が、右側の Output Genes の欄に並びます。
Gene Filter: で「OR」をクリックしてオンにした状態では、チェックしたGO Term に関連づけられた遺伝子がすべて(ORで)並びます。

Gene Filter: で「AND」をクリックしてオンにした状態では、チェックしたそれぞれのGO Term に関連づけられた遺伝子のうち、すべての GO Term に共通に関連したものだけ(AND)が並びます。

Reset Selection」をクリックすると、すべての GO Term のチェックが消えてオフになります。

このようにして得られた遺伝子のリストを、最後に保存して Heatmap で使うことができます。

4-2. 単語サーチのやり方について

まず、Filter の行で「Show all terms」をクリックしてオンにしてください。

Terms」をクリックしてオンにしてください。
この状態で、上部の「Search…」の領域に単語を入れて、「Search」のボタンをクリックすると、その単語を含む GO Term のみが表示されるようになります。

「Terms」ではなく「Genes」をクリックしてオンにした状態で「Search」すると、その単語を含む Gene に関連する GO Term のみが表示されるようになります。

この状態で、必要な GO Term にチェックを入れていってください。

Show all terms」ではなく、「Show only selected terms」や「Show only unselected terms」を活用すると、GO Termを選ぶ助けになります。

「Terms」の検索においてのみ、「Search…」の領域に単語2つ以上を半角スペースで区切って単語列として入れると、その単語列でサーチが行われます。
(例): actin filament nucleation

また、「Terms」と「Genes」の両方の検索において、半角カンマ「 , 」で区切って入れると、単語のAND検索(どの単語も含むものを検索)になります。
(例): biosynthetic , process

Clear Filter」をクリックすると、サーチによる絞り込みを行なわない状態の表示になります。

4-3. Gene Filter: について(AND / OR)
画面右側「Output Genes」の上の「Gene Filter」を切り替えることによって、選択したGO Term から遺伝子を選ぶ方法を変えることができます。

ANDにすると、選択した GO Term で共通する遺伝子を抽出します。
ORにすると、選択したGO Term のいずれかに含まれる遺伝子を抽出します。

4-4. GO Termsの選択解除について
現在の全GOリストより、新たに GO Term を選別し遺伝子を絞り込みたい場合は、画面上部の「Reset Selection」をクリックします。

5. 結果のファイルをMyDataへ保存
選択した遺伝子のリストを MyData 領域へ保存します。

5-1. 「Save」をクリックしてください。
MyData へ保存するための画面が現れます。

image70

5-2. 保存ファイル名と説明文を入力して、「Save to MyData」をクリックしてください。
この保存ファイル名は半角英数字にしてください。また、この次に Heatmap で Gene Symbol File を指定する時に使いますので、必ず記録しておいてください。

6. Gene Selection Tool を終了
ウェブブラウザで現在のタブを閉じれば、Gene Selection Tool が終了します。
ウェブブラウザで 隣の元のタブを開けば、Heatmap へ戻ります。


5.4. ファイルをアップロードする

ここまでで用意したメインファイルと補助データファイルを、手元PCから RIAS の MyData 領域へアップロードします。ただし、5.2.2 の Gene Selection Tool で作った Gene Selection File は、最後の段階で MyData 領域に既に保存されていますので、アップロードは不要です。

5.4.1. MyData ページを表示させる

画面右上の「MyDataボタン」 をクリックしてください。
新しいタブが開き、これまでにアップロードされたファイルの一覧が確認できます。
9ecc9856-5e98-11ee-80dc-061da1ef3444.png?ref=thumb

5.4.2. アップロード操作を開始

MyData へファイルをアップロードするために、まず画面左の「Add」をクリックしてください。
image73

5.4.3. ファイル選択を開始

MyData領域へアップロードするメインファイルと補助データファイル(Class File)を手元PCの中から選択するため、まずファイルアイコンをクリックしてください。
image74

5.4.4. メインファイルを選択

まずはメインファイルを選択し「開く」をクリックします。
image75

5.4.5. 補助ファイルを選択

Class File を選択するため、左下のアイコンをクリックし、ファイルを選択します。
Gene Symbol File も同様に選択してください。
ファイルの選択はひとつずつ行ってください。
image76

5.4.6. アップロードを実行

手元PC から MyData 領域へアップロードしたいファイルを選択したら、「Upload To Mydata」をクリックしてください。
image77

5.4.7. アップロード結果を確認

アップロードしたファイルが MyData の一覧リストに載っていることを確認してください。
image78

5.5. 設定を行いグラフ作成する

上記で MyData へアップロードしたデータファイルを利用して、Heatmap のグラフを作成するために各種の設定を行い、作成を実行します。

5.5.1. Heatmap のページへ戻る

ブラウザの元の Visualization のタブをクリックして、Heatmap のページへ戻ってください。

5.5.2. メインファイルを指定

Heatmap のページの Setting: 領域で、メインファイルを指定するために「Main File」の右端にあるファイルアイコンをクリックしてください。
image80

5.5.3. メインファイルを指定(続き)

MyDataの一覧「Files」が表示されますので、先ほどアップロードしたメインファイルの右端にある「Select」をクリックしてください。
image81

5.5.4. メインファイル指定を確認

選択したファイルが、Setting 領域の Main File に現れていることを確認してください。
image82

5.5.5. 補助データファイルを指定

Class File と Gene Symbol File についても、上記と同様にして指定し、それぞれの場所に載せます。必要なファイルがすべて表示されていることを確認してください。(Main Fileは必須ですが、Class File と Gene Symbol File は指定しなくてもかまいません。)
image83

5.5.6. パラメタを指定

Setting 領域にあるパラメタを必要に応じて設定してください。パラメタ指定は変更が必要なければ、そのままのデフォルト設定のままでもグラフ作成は実行できます。

5.5.7. グラフ作成を開始

画面の下方にある「Execute」をクリックしてください。グラフの作成が始まります。
image84

5.6. 作成されたグラフを確認する

Heatmapの Graph: 領域に作成された グラフが表示されます。

必要に応じて、Setting:領域のファイル指定やパラメタ指定を変更して「Execute」を再びクリックすれば、その新しい設定でグラフを作成しなおすことができます。
Graph: 領域の上部のタブをクリックして切り替えると、グラフ作成結果の各情報が表示されます。

  • Graph タブ: 作成したグラフ

  • Empty Graph タブ: 上記のグラフから文字・数字を削除したもの

  • Main File タブ: Setting で指定したメインファイルの内容(最初の20行のみ)

  • Class File タブ: Setting で指定したClass Fileの内容(最初の20行のみ)

  • Gene Symbol タブ: Setting で指定したGene Symbol Fileの内容(最初の20行のみ)

  • Extracted Data タブ: オプション指定によりフィルタリングされたデータの内容

  • Reordered Data タブ: クラスタリングで行の並べ替えを行ったデータの内容

    (各表の横スクロールバーは表の最下部にあります。)

5.7. 作成されたグラフを保存する

作成結果のグラフとデータを、手元PCへダウンロードして保存することができます。これらは、論文や報告書などに転載して利用することができます。

作成されたグラフの文字・数字の大きさやフォントを変えたい・不要な文字数字を消したい、など、グラフ内の文字・数字が目的に沿わない場合には、Empty Graph に文字・数字が無いグラフがありますので適宜、文字・数字を書き入れてご利用ください。

保存方法は以下の2つがあります。

・Download ボタンを利用する方法
・Histories(履歴)を利用する方法

5.7.1. Downloadボタンを利用する方法

グラフ作成を実行した後では、「Execute」ボタンの隣に「Download」ボタンが表示されます。これをクリックすると、画像データを含む全データを手元PCへダウンロードします。データは1つの zipファイルになります。

image85

5.6.2. Histories(履歴)を利用する方法

画面の右上の「Historiesボタン」をクリックすると、ブラウザに新しいタブが開いて、これまでに実行された履歴の一覧が表示されます。

073bf65a-4627-11ee-b721-061da1ef3444.png?ref=thumb

履歴のページでは最後に実行した解析が履歴の最上位に記載されるようになっています。実行され画像が確認できた場合にはと表示され、実行に問題が生じた場合はと表示されます。

この右側のアイコンをクリックすると、画像やデータを含むzipファイルをダウンロードします。



6. よくあるご質問

頻繁にいただくご質問とその対処法を紹介します。ここにある問題に遭遇された際は、まずこちらの対処法をお試しください。

対処法が良くわからない場合や解決しない場合は、以下フォームからお問い合わせください。
RIAS – 利用方法に関するご質問フォーム
RIAS – 不具合・問題報告フォーム

Q1. Heatmap・Complex Heatmapなどで計算が終わらない。グラフが表示されない。
A1. クラスタリングを行う際など大規模な入力では、計算量等の都合で計算が完了しない場合や画像が表示されない場合があります。その際は入力ファイルの行数を減らす、または"Input cutoff of significant values"などの足切り閾値を高く設定して処理に利用する行数を減らすなどすると、解決する場合があります。目安としては20,000行を超える入力では計算にかなり時間がかかる(終わらない)という現象が発生します。

Q2. Heatmapやそのカラーキーに白線が入る。
A2. この問題は画像解像度やサイズの関係で発生します。主に横方向の画像サイズを調整すると改善する場合が多いので、お試しください。

Q3. ダウンロードしたファイルを表示させると文字化けする。
A2. ダウンロードしたファイルの文字コードは UTF-8 になっています。Excel やテキストエディタなどで読み込む際に UTF-8 を指定してみてください。

Q4. 作成したグラフの文字・数字の大きさやフォントを変えたい。不要な文字数字を消したい。
A4. 作成されたグラフの文字・数字の大きさやフォントを変えたい・不要な文字数字を消したい、など、グラフ内の文字・数字が目的に沿わない場合には、Empty Graph に文字・数字が無いグラフがありますので、こちらに適宜、文字・数字を書き入れてご利用ください。



7. 用語集

Visualizationの画面で現れる用語とその意味について記載をしました。

  • p-value:帰無仮説が正しいという仮定の下で、どの程度特別な事象かを示す統計値(確率)です。例えば、特定の遺伝子に対して2つの2群間で差がないという過程(帰無仮説)のもとで、実際の差がどの程度特別なものかを評価します。

  • adjusted p-value:サンプル数や要素数に基づき、p-valueを補正した統計値です。

  • FDR(false discovery rate) :棄却された帰無仮説のうち真に帰無仮説が正しいものの割合の期待値を示す統計値です。得られた判定がどのくらいの精度かを示す指標です。

  • DEG(differentially expressed genes) :特定の群間で発現量に差のある遺伝子のことを指します。


8. ご利用規定・免責事項

本システム RIAS Visualization を用いて得られた結果について、これに起因する損失・損害等は弊社は責任を負いかねます。
また、MyDataへアップロードしたデータや解析結果データは、ご自身で別の場所へバックアップ保存してください。
データの消失等に起因する損失・損害等は弊社は責任を負いかねます。
あらかじめご了承ください。

RIAS Visualization は、Rhelixaアカウント(無料)を取得して頂き Visualization のライセンスを申し込んで頂いた方にご利用いただけます。こちらにご利用規約がありますので、ご確認・ご了承の上ご利用ください。


9. 連絡先・お問い合わせ先

本システムの使用方法に関するご質問につきましては、以下フォームからお問い合わせください。
RIAS – 利用方法に関するご質問フォーム
RIAS – 不具合・問題報告フォーム

発展的な解析のご相談につきましては、customer-service@rhelixa.com までご連絡ください。
 

株式会社Rhelixaについて

生命科学研究の発展を加速することをミッションとし、最先端のゲノム・エピゲノム解析で培ってきた技術を活用して、生物学・医学・薬学領域における基礎研究や製品・ソリューションの開発、またはそれらの受託業務を行っています。また、研究開発のあらゆる場面で必要となるデータの統計解析や機械学習、図版作成を基礎知識を必要とせず誰もが手元で実現できる環境を提供していきます。

会社名 株式会社Rhelixa(レリクサ)
設立 2015年2月
本社 〒104-0042 東京都中央区入船 3-7-2 KDX銀座イーストビル 5F
事業内容 ・オミクス解析の受託およびコンサルティングサービス
・研究支援クラウドツールの開発・運営