Webページへの公開情報を自動的に抽出・取得する
Friday, June 5th, 2009Webページには、さまざまなデータ・情報が公開されている。商品情報、その価格、為替レート、株価などなどだ。こうした情報を定期的に自動取得できる仕組みを作っておけば、情報の有効な活用ができる。複数のWebページから取得したデータを独自の視点から組み合わせ、自分・独自の情報システムを構築することだって可能だ。Reuterのニュースサイトから為替レートを自動取得する方法を試し、その可能性を考えてみた。
Webページには、さまざまなデータ・情報が公開されている。商品情報、その価格、為替レート、株価などなどだ。こうした情報を定期的に自動取得できる仕組みを作っておけば、情報の有効な活用ができる。複数のWebページから取得したデータを独自の視点から組み合わせ、自分・独自の情報システムを構築することだって可能だ。Reuterのニュースサイトから為替レートを自動取得する方法を試し、その可能性を考えてみた。
このブログ、自宅に設置したPCサーバーから発信している。最近、このサーバー用PCの騒音がかなり気になってきた。いろいろ検討してきたが、結局、我が書斎においていたこのPCを普段はだれもいない部屋に移動することにした。当然のこととはいえ、我が書斎、とっても静かになった。
今日で4月も終わり。11日に「Red5の利用:Flashファイルの作成とWPポスト上への埋め込み」を書いて、20日が過ぎる。いろいろやってみたが、Red5を利用しようとするのは、結構、敷居が高いなと感じた。で、方針を変更。Red5利用のための作業はしばらく中断することにした。
我がサーバーマシン、恥ずかしいことに、なんらデータのバックアップをすることなく運用してきた。サーバーを立ち上げて2年間、ほぼ24時間運転しているにもかかわらずだ。ここらで、データをバックアップしておかねばということで、USBファイルに最低限必要なものをバックアップすることにした。このエントリでは、USBメモリーでのデータバックアップの手続きをメモする。 (続きを読む)
CentOS5.3が4月1日にリリースされたのを知り、我がサーバーでもアップグレード作業をおこなった。また、この機会にということで、clamavそしてWordPressについても最新版に更新した。このエントリーは更新時作業のメモとして残したもの。