バイオメディカルデータ解析ゲートウェイ
Takeru Galaxyは、バイオメディカル分野を中心とした多数の標準的な解析ツールを、ブラウザベースで動作するよう構築・実装。データ解析の基盤としてその利用技術やシステム運用をサポートし、データ解析へのいわばゲートウェイとするサービスです。
Dockerコンテナ技術との融合により再現性を高めたTakeru Galaxyが、データ解析サーバーTakeruシリーズとの組み合わせにより、研究チーム全体で利用できるデータ解析システムの構築を可能とします。
バイオメディカル研究データ解析で広く使われるソフトウェアGalaxyを用い、GUIによる直感的な操作でデータ解析を実行できます。解析ツールのパラメーター変更もwebブラウザ内で可能。コマンドラインでLinuxを利用する技術なしでもデータ解析が可能になります。
シーケンサーから出力されたデータを登録しGalaxy上の各ユーザーが共有するところからはじまり、解析ツールや作成した解析パイプラインもGalaxy上で共有可能。チームでの解析や研究を加速できます。
定評ある構築済みデータ解析システムTakeruシリーズと組み合わせ、ハードウェアからGalaxyまで利用技術を含めてトータルにサポート。製造から構築・サポートまでを1社で行うことによる一貫したサポートが得られます。
Galaxyは、ツールの実行から結果の確認までGUIで可能なところが最大の魅力です。加えて、ツール、パイプライン、データの共有をよく考えられて作り込まれていることもユーザーにとって良い点です。例えば、シーケンサーから出力されたリードをShared Data -> Data Libraries機能を使い登録してもらえば、出力データが各ユーザーへ配布され共有できます。実行した解析はHistoryに残りこれも共有可能なため、検証や再実行など解析の再現という点でも優れています。Galaxyはオープンな開発体制で情報が多く公開されており、誰でも簡単に試すことができる点も魅力です。
解析システムの担当者にとっては、コマンドラインに明るくないユーザーでもシーケンサーのデータに触れることができ、その結果を生かせることが最も大きなメリットです。必要なツールの多くはGalaxy Tool Shedに公開されているうえ、Tool Shedにない場合も自身で作り出してGalaxyで利用可能にするための十分な情報が世の中にあります。データ共有機能も充実しており、管理者がData Librariesにデータを登録することで各ユーザーが利用可能になります。また、ジョブスケジューラーUniva Grid Engineとの組み合わせによる拡張性や、Dockerコンテナ技術との組み合わせによる再現性の向上など、解析システムの高度化にも道が拓けています。
Galaxyはオープンソースソフトウェアとして、米国を中心とした複数の大学や研究所によるチームにて2005年から開発が開始されています。ほぼ毎日更新される公開の開発者チャット、GitLabで300以上のstar、毎年200人規模となる開発コミュニティ会議の開催など、2017年現在も開発コミュニティが活発です。Galaxyを採用している公共サーバーは国内・国外合わせて80以上存在し、特に国内では、各研究機関で使用されているワークフローの共有や過去に実行されたワークフローの再現性向上を目指すPitagora Galaxyプロジェクトが積極的な開発、発信を行うなど、Galaxyは国内外で広く使用されています。引用論文は2017年7月現在で4,500報を超えています。Galaxy内に設定済みのツール800以上、参照できるデータベースの数約200、AWS等クラウド環境やコンテナ仮想化への対応、可視化ツールの充実など機能拡充もさることながら、ソフトウェア操作体験トレーニングや多様なチュートリアル資料などサポートも整備されている点は、オープンソースソフトウェアとしてかなりの充実度といえます。
Galaxy Tool Shedにあるツールのインストールやリファレンスゲノムの設定はもちろん、Tool Shedにないツールや独自パイプラインのGalaxyツール化などご相談いただけます。
ユーザーの追加やパスワードの変更といったユーザー管理から、データの登録、共有、Galaxy上でツールをつなげてパイプライン化するWorkflowなど、「Galaxyの使い方」をサポートします。
CLIレベルでの解析ツールやパイプラインをDockerコンテナ技術で周辺環境ごとパッキング。Galaxyでの解析もコマンドラインでの解析も、同一バージョンのツールを使用することができます。一度コンテナ化しておけば、Galaxy本体のupdateの際にも有利です。インターネットに接続していなくても利用できるよう、コンテナをシステム内に保管できるDocker Private registryや内部開発コードを管理できるGitLabなどもご用意しています。
次世代シーケンサーデータ解析標準システムTakeru for Sequencer VをはじめとしたTakeruシリーズとの組み合わせにより、目的にあわせた最適なサイズの解析システムを構築可能です。ハードウェア、OS、ミドルウェアから、解析ソフトウェアが動作する状態でシステムとしてサポートされます。また、GPGPU搭載の計算ノード追加により、ディープラーニング対応のシステムに発展させることも可能です。
ユーザーがTakeru Galaxyを操作できるよう、ハンズオン講習の実施をサポートします。例えば、
Takeru Galaxyトップページにアクセス
→自前の解析対象ファイルをTakeru Galaxyにアップロード
→Takeru GalaxyにてBowtie2を用いてマッピングを実行
→その他のツールを加えて個々のユーザー向け解析パイプラインを作成(GalaxyにおけるWorkflow機能を用いる)
という一連の流れについて、必要に応じてTakeru Galaxy標準メニューをカスタマイズする等、Galaxy Administratorとなる方に協力してハンズオン講習のサポートを行います。
Takeru Galaxy Core | Takeru Galaxy Basic Support | Takeru Galaxy Advanced Support | |
---|---|---|---|
Galaxy本体(開発元からダウンロードしたもの) | Takeru Galaxy Coreに加え | Takeru Galaxy Core、Takeru Galaxy Basic Supportに加え | |
ツール構築済み(NGSマッピングツール、samtools等ユーティリティを追加済み) | ツール追加(開発元Tool Shedに含まれないもの、自作ツール他) | ||
ツール追加(開発元Tool Shedに含まれるもの) | オリジナル解析パイプラインのDockerコンテナ化、Galaxyへの実装 | ||
解析パイプライン(開発元Tool Shedに含まれるツールのみ使用の場合)のDockerコンテナ化、Galaxyへの実装 | Galaxy配布サーバー構築、複数Galaxy運用向け構築、他 | ||
参照データベース構築(例:bowtie2にてhg19) | |||
計算リソースを効率良く使用するためのジョブスケジューラ―連携 | |||
ファイル保存場所別アップロード設定(ローカル、Galaxyホストサーバー、ネットワーク外) | |||
コンテナイメージ保存場所構築 ※既存Takeruの場合、Docker対応が必要となる場合があります | |||
年間最大20時間のリモート接続によるサポート ※Takeru Project-Lifetime Support契約を前提といたします | |||
※追加ご希望ツールやデータベースの数量が多い場合はご相談ください |
※クラウド対応についてはご相談ください。
Takeru Galaxy込みのall-in-oneなサーバーです。
Takeru Galaxy Basic Support(納入後1年間) | |
CPU | Intel Xeon (Scalable Family) ×2 |
---|---|
Memory | 128GB |
Drive | 6TB SATA HDD×8+予備×1 |
Graphics | Nvidia Quadro K620 |
Network | 1000Base-T×2 |
Chassis | 19" 4U rackmountable tower |
OS/設定 | Cent OS for x86_64, MPI/PVM構築済み, Univa Grid Engine構築済み(サブスクリプション1年) |
付属品 | 25" 液晶ディスプレイ, キーボード, マウス |
UPS | |
搬入・設置・動作確認作業含む | |
システムオンサイト保守(納入後1年間)(年20時間以内のTakeru Project-Lifetime Support含む) |