Hatena::Groupkdri

KazusaAPI開発日誌 このページをアンテナに追加 RSSフィード

2007-02-04

Kazusa API開発日誌

|  Kazusa API開発日誌 - KazusaAPI開発日誌 を含むブックマーク はてなブックマーク -  Kazusa API開発日誌 - KazusaAPI開発日誌  Kazusa API開発日誌 - KazusaAPI開発日誌 のブックマークコメント

ゲノム情報利用ワークショップ2007での発表をテキストに起こしてみました。

Kazusa API制作日誌

  • 中尾 光輝/かずさディー・エヌ・エー研究所/植物ゲノム情報研究室
  • Kazusa APIとは?
    • 「KEGG API のようなものです。」
    • 先駆者がいるので説明がラク!ありがとう!
  • Kazusa API
  • 四月
    • 入所
    • あたらしく立ち上がった植物ゲノム情報研究室
    • 「「植物」に限らず好きなことをしてもよい」
    • ウェブサービス/解析ワークフロー/マッシュアップ/に未来があると思った。
    • そういえば、かずさのリソースはCGIでしか公開していないなそれにウェブサービスを追加するといいのではなかろうか
  • 五月
    • リソースの調査をした
    • これは外部向けのリソース
    • 内部向けのリソースはこんなもんじゃない
  • 内部リソース
    • 特徴
      • 公開前のデータ
      • 更新が頻繁
      • 過去のバージョン
      • バージョン間のID変換
    • データの種類
      • 配列
        • リード、ゲノム、EST、cDNA
        • マーカー
      • アノテーション
      • 遺伝子構造、遺伝子機能、YTH
    • 表示の種類
      • ゲノムブラウザー
      • 遺伝子ブラウザー
      • ホロモグ表
      • 機能ドメイン表
      • キーワード検索
    • ブラウザ/表/検索
  • 六月
    • ニーズの調査をした
    • ユーザー像
      • 研究者/テクニカルスタッフ/マシン管理者
    • 研究者
      • データをブラウズ
      • データを検索、選択
      • データをサマライズ、可視化
      • 最新のデータ
      • 古いデータの追跡
    • テクニカルスタッフ
      • ツールの開発の効率化
      • 引き継ぎを簡単に
      • データ管理の効率化
    • マシン管理者
      • ネットワーク帯域
      • セキュリティー
      • インストール簡単?
      • データ量
  • 七月
    • 調査の結果から
      • 現状は堅牢
      • 10年間の蓄積
      • 柔軟性に難点
      • 比較ゲノム解析など比較的あたらしい研究には対応するのは大変そう
      • ウェブサービスで解決したい
  • 八月
    • 実装の検討をした
    • 実装パターン
      • プロキシ型
      • 実装置換型
    • プロキシ型
      • メリット
        • サーバに手を加えない
        • 構成が簡単
      • デメリット
        • 速度面
        • 作るプログラム数が多い
        • APIの設計に制限がある
        • 現状のシステムの限界を継承してしまう
      • gbrowse のデータを SOAP で
    • 実装置換型
      • メリット
        • 新しい実装
        • 速度面
      • デメリット
        • 動いているサーバを置き換えるリスク
        • 作るプログラムが複雑化
    • CyanoBaseの場合
      • http://www.kazusa.or.jp/cyano/
      • シアノバクテリアのゲノムデータベース
      • Ruby on Rails で置換実験中.
      • ORF単位のアノテーションをブラウズ
      • 内部ページでは、あたらしい実験情報(YTHなど)を付加
    • CyanoBase on Rails
      • メリット
        • 新設計
        • 管理運用に必要なファイル数の減少
      • デメリット
        • 刷新リスク
        • RDBスキーマの設計コスト
    • リソースの分離
      • CyanoBase
        • 保持するデータ
        • ORF名
        • アノテーション
        • 配列は gbrowse
    • 汎用ゲノムブラウザ:gbrowse
      • 任意の配列の取得ができる
      • DASサーバ
    • blast hits
      • blast hits のデータベースに分離
      • フラットファイルからRDBへ
    • iprscan
      • InterProScan の検索結果のデータベースに分離
      • フラットファイルからRDBへ
    • リソースの分離
      • 依存性 ↓
      • 拡張性 ↑
  • 九月
    • データの交換形式
      • SOAP
        • クライアント側がラク
        • URI が存在しない
        • 互換性があやしげ
    • データ交換形式
    • Kazusa API
      • SOAP に限らず
      • 複数のプロトコルに対応
      • UI/クライアント
      • URIデザイン
      • 高速化手法
  • 十月
  • 十一月
  • 十二月
    • 分子生物学会年会@名古屋
  • 一月
    • ゲノム情報利用ワークショップ
    • 続く。
  • まとめ
    • Kazusa API
      • リソースの別の入り口を提供
      • リソースの分離、合理化をすすめる
      • CyanoBaseのAPIは年度中に外部公開したい
      • ウェブサービスはどこにいったのか?
  • 終わり

言えなかったこと。MVC に絡めた説明。


ライトニングトーク

  • ゲノム情報利用ワークショップ
  • ライトニングトーク
  • 中尾光輝
  • なかお みつてる
  • かずさDNA研所属
  • 他のスピーカーとの関係
  • Kazusa API
    • 研究所内データベースとツールの再構築
    • ある意味、リファクタリング
  • Kazusa API 制作日誌
    • 明日
    • 発表
    • 朝一
    • 9:30から
    • (朝早い!)
    • 今夜はほどほどに
  • 中尾光輝の仕事
  • BioRuby
  • BioRuby
    • Bio::SwissProt, Bio::EMBL, Bio::Blast::Report, Bio::Iprscan, test/unit/test_*.rb など
  • http://b-src.cbrc.jp
    • ソースコード検索サーバ
    • バイオインフォマティクス専用
  • GIW オープンバイオBoF
  • 「RとBioconductorによるバイオインフォマティクス(仮)」
    • この春にシュプリンガー・ジャパンから出版!
    • 以上、宣伝でした m(_,_)m
  • 時間、残りあります?
  • Kazusa APIの最新機能を紹介
    • Kazusa Nafuda-kun
    • かずさ名札君
    • ワークショップ開催を強力にバックアップ
    • 名札ワークフローの実現
    • これはすごい!
トラックバック - http://kdri.g.hatena.ne.jp/nakao_mitsuteru/20070204