« JMFで動画に字幕文字列をオーバレイするプログラムのソースコード | トップページ | JavaFXでFLVを再生してみた »

2008/11/30

Groovyを試してみる

パラパラとページをめくっていたら「スクレイピング」の文字が見えたので、試してみることに。個人的に、スクリプト系言語は文字列操作用、という偏見もあるのだが、Javaでこういったことをやろうとするとなかなか大変なのは事実だろう。

参考にした箇所はp.422「13.5.1 HTMLページからデータの抽出」節。

コードは以下。ニコニコ動画で指定したキーワード(ここでは"紅葉")を検索し、件名とファイルのIDを取得する。(ソースコード, 結果出力)

import org.cyberneko.html.parsers.SAXParser
import nicobrowser.NicoHttpClient 

def nico = NicoHttpClient.getInstance()
nico.login 'id@mail.address','password'
def is = nico.search('紅葉') 

def html = new XmlSlurper(new SAXParser()).parse(is)
def res = html.'**'.findAll{it.attributes()['class'] == 'video'} //9.動画へのリンクを抽出
def id = res*.attributes()['href']*.replaceAll('watch/','')  //10.リンク文字列を編集

println res // 検索結果の件名
println id // 検索結果のファイルID 

実質、9,10行目の2行で処理している。ただし何をやっているのかは私にはまだ分からない...

実行に必要なものはNekoHtmlXerces2, NicoBrowser一式今回用に改造したjarを上書きしたもの。

しかし、NetBeans上でGroovyを動かしてもコード補完も無いしエラーも分かりづらいしで、入門者には敷居が高いと感じる。

 

追記:コードが見難いのでこちらにソースコードと出力結果を置いておいた。

« JMFで動画に字幕文字列をオーバレイするプログラムのソースコード | トップページ | JavaFXでFLVを再生してみた »

コメント

この記事へのコメントは終了しました。

トラックバック


この記事へのトラックバック一覧です: Groovyを試してみる:

« JMFで動画に字幕文字列をオーバレイするプログラムのソースコード | トップページ | JavaFXでFLVを再生してみた »

other sites

  • follow us in feedly
  • github
  • stackoverflow

ソフトウェアエンジニアとして影響を受けた書籍

  • Christain Bauer: HIBERNATE イン アクション

    Christain Bauer: HIBERNATE イン アクション
    理論と実践が双方とも素晴らしい製品であるHibernate。本書はそのプロダクトを書名に冠していますが、Hibernateを使うつもりがなく、ORマッピングの解説書として読むにしても十分な良書です。Second EditionとしてJava Persistence With Hibernateという書籍も出版されていますが、残念ながら現在のところ 和訳はされていません。-インアクションは2.xの、Java Persistence-は3.1の頃のものなので、最新版とはちょっと違うところもあることに注意。 (★★★★★)

  • アンドリュー・S・タネンバウム: 分散システム 原理とパラダイム 第2版

    アンドリュー・S・タネンバウム: 分散システム 原理とパラダイム 第2版
    クライアント/サーバシステムを構築する上で必要となる知識が総論されてます。Web技術者も、フレームワーク部分を開発するのであれば必読。 (★★★★★)

  • Joel Spolsky∥著: ジョエル・オン・ソフトウェア

    Joel Spolsky∥著: ジョエル・オン・ソフトウェア
    前述の書籍「ソフトウエア開発プロフェッショナル」をより砕いたもの、という感じでしょうか。 前書きではプログラマでなくSE向けの本のように書かれているが、プログラマが読んでも面白い本であると思われます。 SEになった新人(あるいはそういう会社に入る/入りたての人)にとっては、これからどういったことが仕事を遂行していく上で起こりえるのか、どのように考えて行なっていけばいいのか決定する助けになると思います。 元は″Joel on Software″というブログの記事で、web上でも一部日本語で読めます。 http://japanese.joelonsoftware.com/ (★★★)

  • ドナルド・C・ゴース,ジェラルド・M・ワインバーグ: ライト、ついてますか

    ドナルド・C・ゴース,ジェラルド・M・ワインバーグ: ライト、ついてますか
    問題解決(一昔前のの流行語で言うところの『ソリューション』)能力は、システムエンジニアのスキルとして備えるべきもののうちのひとつです。しかし、これは難しい。学校で出されるテストと違い、唯一の、(問題提出者が想定している)解を求めるだけが「問題解決」では無いからです。そもそも、何が問題なのか、それは本当に問題なのか、それは本当に解決すべき問題なのか、その問題解決方法は正しいのか、などを解決しなければ、「その解は正しいのか」に辿りつくことができません。この本の最も良いところのひとつは、本があまり厚くないこと。すぐに読めるし、何回も読み返す気になるでしょう。 (★★★★★)

  • スティーブ・マコネル: ソフトウエア開発プロフェッショナル

    スティーブ・マコネル: ソフトウエア開発プロフェッショナル
    コードコンプリートで有名なスティーブマコネルの著書。新人SEに読んで欲しい。個人として業界の中でどうあるべきか、組織としてどうあるべきか、SEのプロ意識とは?SEの心構え概論、といったところでしょうか。また、業界における資格の重要性についても説かれています。この業界では資格が特に軽んじられる傾向がありますが、この傾向はどんな弊害をもたらすのか、将来的にこの業界は資格に対してどのような姿勢で臨んでいくべきなのか。日経BP社では(他の出版社もだが)最近、似たような類いのあまり面白くない書籍が乱出版されていますが、この本は別格だと思うので安心して購入して欲しいと思います。 (★★★★★)

無料ブログはココログ