UCSD 研修体験記 (荒木 嶺)

はじめに

大阪大学の海外インターンシッププログラムで、2012年8月24日から2012年11月 17日までの約3か月間、アメリカのカリフォルニア州にあるUCSD(University of California, San Diego)において研修を受ける機会を頂きました。ここでは、その体験について報告します。

サンディエゴ

サンディエゴはアメリカ西海岸にあるカリフォルニア州の最南端に位置する人口およそ120万人の都市です。サンディエゴはメキシコまで車でおよそ30分で行けるほどメキシコに近く、もともとメキシコ領であったことから地名や通りの名前には今でも多くのスペイン語由来の名前が多くみられる都市です。今でもメキシコから移り住んでくる人が多いため、街中の表記のほとんどには英語とスペイン語が併記されています。 また、年間を通して気候も穏やかなこともあり、アメリカで最も住みたい都市のランキングでニューヨークに次いで2番目に住みたい都市になるほど良い都市です。

サンディエゴ市内の風景

カリフォルニア州立大学サンディエゴ校(University of California, San Diego)

UCSDはサンディエゴの市内から車で30分ほど北にあたるLa Jollaという市に位置する、カリフォルニア州立大学のうちの1つです。UCSDは学生職員を合わせておよそ3万人が通う大学であり、キャンパスも広大でかつ海に近く自然豊かな大学です。また、大学の周辺にはSDSC(サンディエゴスーパーコンピュータセンター)、Soak研究所(DNAの二重らせん構造を提唱しノーベル賞を受賞されたフランシス・クリック博士が研究生活を送った)などの研究機関も隣接し、情報科学や生物工学などが盛んに研究されていることが見て取れます。
また、西海岸に位置する大学ということもあり、学内には非常に多くのアジア人がいる。学内のカフェテリアも国際色豊かなものになっていました。

キャンパス内の風景

研修内容

今回の海外インターンでは、Cytoscapeと呼ばれるソフトウェアのプラグイン開発を行いました。Cytoscapeとは今回の留学の受け入れ先であるIdeker研究室で開発された、ネットワークの可視化と解析のためのオープンソース・プラットフォームです。このソフトウェアはシステムバイオロジーや社会学などの分野で広く使われており、様々なネットワーク解析を行うためにプラグインは現在約150個開発されています。今回開発したプラグインはBiomarkerと呼ばれるサブネットワークをタンパク質間相互作用ネットワークから取り出すというものです。従来では遺伝子単体で疾病の状態予測を行う遺伝子マーカーに関する研究が数多く行われていました。しかし、生体内では遺伝子単体で機能するのではなく、タンパク質の複合体として機能することから、疾病の予測を行うための複合体つまりBiomarkerに関する研究が現在盛んに行われています。これらの研究の多くでは、タンパク質間相互作用ネットワークとそのネットワーク中の頂点のスコア(遺伝子の発現変動差,タンパク質量など)、辺の重み(相互作用の信頼度など)を用いてBiomarkerを大規模なネットワークから取り出すための手法を確立してきました。しかし、新たにリリースされたCytoscape 3.0にはBiomarkerを検出するためのプラグインが開発されておらず、Biomarkerを見つけるためのプラグインを開発することを目標としました。また、Biomarkerを見つけるための様々な手法が開発されているので、ユーザーがその中から手法を選べ、また新しい手法も今後実装可能である、Biomarkerを見つける手法のフレームワークとしてのプラグイン開発を行いました。

まず、今回のプラグイン開発では各クラスファイルやインターフェースで、公開する部分と公開しない部分に分け、設計を行っていきました。これは、プラグインの大まかな部分、例えばGUIや入力でネットワークファイルを読み込む部分など、は全てのBiomarker探索手法に共通すると考え、一度開発すればユーザー側で手を加えられないようにし、Biomarker探索のためのアルゴリズム処理部分などは公開し、ユーザーが新たな手法を導入する際の労力を減らすためです。次に、大まかなGUIを実装していきました。GUIを実装する上で注意したことは、まず第一にユーザー目線からどのようなレイアウトにするのが使いやすいかということです。プラグインの実行は、Cytoscapeのメニューバーから行うものも多いのですが、本プラグインでは各Biomarker探索手法ごとにパラメータがあり、パラメータ設定などをメニューバーから行うのは煩わしいと考え、CytoscapeのGUI画面左側に表示されている、Controlパネルに本プラグインのGUIを埋め込むことにしました。また、各手法ごとに共通するGUI(PPIネットワークの入力やノードのスコアファイルの入力など)と各手法に固有のGUI(パラメータなど)を分け、各手法に固有のGUI部分は動的に変化するように実装を行いました。その後、すでに提案されているBiomarker探索手法の1つであるNetwork Propagationと呼ばれる手法の実装に取り掛かりました。この手法は、各ノードに対応付けられたスコアを各エッジの重みに応じて伝播させ、ノード間のスコアの差を滑らかにすることにより、重要な集合を見つけることができます。この実装を行う際に、ユーザーがどのようにスコアが変化したのかを見やすくするために、各ノードの色をそのノードのスコアに応じた色に色付けを行いました。これで、一通りの作業が完了したので、受け入れ先の指導教員に成果を報告し、他に改善案があるかを伺いました。そこで挙げられたのは、スコアを目で見て、大規模なネットワークからBiomarkerとなるノード集合を取り出すのは困難であることから、各Biomarkerを取出し別ウィンドウで表示し、さらに各Biomarkerに含まれるノードに、他の解析を行うためにもグループ番号を割り当ててほしいというものがありました。なので、本プラグインにユーザーが指定した閾値以上のスコアを持つBiomarkerを抽出するための処理を実装し、抽出したBiomarkerを別のウィンドウを開いてそこに描画するように実装を行いました。

これらの作業を通して、ネットワークバイオロジーの分野で現在どのようなことが盛んに研究されているのかを学び、プログラムを実装する際にはメンテナンス性を向上させるためにどのようなコーディングをするのか、また動的に変化するプログラムを作る際にはどのように実装すべきかなどを学習しました。

開発したプラグインのスクリーンショット

サンディエゴでの生活

サンディエゴはアメリカの西海岸の最南端に位置する都市であり、市内からメキシコとの国境まで車でおよそ30分で行くことができます。そのため、サンディエゴでは多くのメキシコ人が暮らしており、街の中いたるところにスペイン語の併記が見られます。今回最初の5週間は、メキシコから移住されてきた方のお宅にホームステイさせていただき、丁度その間に私の誕生日があり、ホームステイ先のお母さんからお祝いのケーキをいただきました。下の写真にあるように、アメリカならではの真っ青なケーキで驚きましたが、とても甘くて美味しくいただきました。このケーキに代表されるように、アメリカの食文化としてお菓子類はカラフルなものが好まれる傾向があるようです。

おわりに

今回の海外インターンシップで多くのことを学ぶことができました。今回は普段の研究生活と違う環境で、さらに短期間での開発に携わることができ、日本にいては中々体験することのできない英語での打ち合わせなどを通して、これからの国際化に対応する力の成長の大きな1歩になったと感じています。 最後に、海外インターンシップの機会を与えてくださった大阪大学とUCSDのスタッフの方々、現地での生活でお世話になったすべての方に心からお礼を申し上げます。