研究者
公共データを用いて、自分の仮説を証明したいけど、僕はプログラミングができないんだよな。どうしよう…
今回は、上記のような「プログラミングはできないが、公共データを利用したい!」という方に、プログラミンを使用しない、クリックだけ使用できるマウス組織のシングルセルトランスクリプトーム解析ツールの Tabula Muris について紹介したいと思います。
公共データベースについて
近年、Cell, Nature, Science (CNS, 3大誌) のような High impact journal に掲載される論文を見た時、網羅的遺伝子解析データ載っていない論文を探す方が難しいぐらい、網羅解析が当たり前の時代になりました。
網羅的遺伝子発現解析結果を論文として発表する際は、人類共通の財産 (公共データ) として誰でもデータを再利用できるようにデータリポジトリに登録することが求められています。データリポジトリとして NCBI の GEO や EMBL-EBI の ArrayExpress があげられます。
公共データの中には、がん患者の遺伝子発現情報と予後が関連づけられているデータ、マウスの多臓器の遺伝子発現解析など、自分では得ることが難しいサンプルのデータが格納されています。
公共データを用いることで、自らデータを解析する必要がありませんし、データの客観性をも持たせることもできます。
今回紹介する公共データの Tabula Muris で作成したグラフは、3大誌の姉妹誌論文の Figure としても利用されているので、自分の論文に Tabula Muris で得たデータを載せて、自分の論文のデータの補強と客観性を持たせましょう!
Tabula Muris の概要
Tabula Muris は、マウスの 20の臓器・組織からの約10万細胞のシングルセルトランスクリプトーム解析の結果を簡単に見ることができるサイトになります (図1)。
以下の3大誌の姉妹誌論文では、Tabula Muris のサイトで作った図を Figure の一部に使用しています。
- Kabir AU. et al., Sci. Transl. Med., 2021 (Figure S1)
- Covarrubias AJ. et al., Nat. Metab., 2020 (Figure 4)
- Egerstedt A. et al., Nat Commun., 2019 (Figure S6)
Tabula Muris の使い方
実例1. 既報 (Kabir AU. et al., Sci. Transl. Med., 2021) を再現する
Kabir AU. et al., Sci. Transl. Med., 2021 の Figure S1 で示されているデータを実際に作ってみようと思います。この論文の Figure S1A で、MYC Target 1 (Myct1) が内皮細胞 (Endothelial cells) に限局して発現していることを示しています。
Tabula Muris のサイトを開く (図2)。
Tabula Muris (https://tabula-muris.ds.czbiohub.org/) を検索します。
サイトの下にいくと Visualization の項目にきます (図3)。
【Method】FACS か droplet を選択する。
- droplet: 細胞数が多いが、検出できる遺伝子数が少ない。
- FACS: 細胞数は少ないが、検出できる遺伝子が多い。
【Tisssue】調べたい臓器を選択する(droplet では調べられない臓器が一部存在)。
【Gene】調べたい遺伝子名を入れる
今回は、腎臓の細胞懸濁液を FACS でソーティングした細胞における myct1 の発現を見てみます。
すると、図4のような tSNE プロットの結果が自動的に表示されます。
- 図4左: Myct1 を発現している細胞を青色で示している
- 図4右: 細胞種ごとに色付けされている
発現量を Violin Plot でも表示することができます (図5)。
解析結果1, 2 から、mRNA レベルにおいてはMyct1 を発現している細胞の大部分は内皮細胞であるという Kabir AU. et al., Sci. Transl. Med., 2021 の Figure S1 を再現することができました。
グラフを保存
図4, 5 のグラフは右クリックで「名前をつけて保存」を選択することで PNG 形式で保存が可能です。
以上が、Tabula Muris の使い方になります。
実例2. 脂肪における炎症性サイトカイン IL-6 を産生している細胞は何か?
脂肪における炎症を惹起する細胞が何かを知るために、炎症性サイトカインとして有名な IL-6 を発現を調べてみました (図6)。
脂肪において、炎症性サイトカイン IL-6 を産生している可能性の高い細胞が間葉系幹細胞 ( Mesenchymal stem cell, MSC) である可能性が示唆されました。
このように、自分の興味のあるタンパク質の発現を実験せずに調べることができます!
しかし、ここで注意しなければいけないこととして、脂肪組織なのに脂肪細胞 (adipocyte) が存在しないという点です。おそらく脂肪組織から細胞懸濁液を作製する手技が原因であると考えられます。遠心操作の際、細胞質に脂肪滴をもつ脂肪細胞は浮いてしまい、組織を分散液と同時に捨てられてしまうからだと考えられます。
このように自分で実験をしていないからこそ、実験の限界を理解するのが難しくなっているので、データの解釈には注意が必要になります。
まとめ
Tabula Muris は、プログラミングなしにブラウザ上でクリックと文字入力のみで、論文レベルのシングルセルトランスクリプトーム解析ができるサイトになっています。
自分の証明したい仮説や組織内での相互作用を理解する時に利用することで、自分のデータをより強固にすることができます!
ぜひ、活用してみてください!
コメント