« 2006年9月 | トップページ | 2006年11月 »

2006年10月31日 (火)

ウォルマートがOpenLaszloを採用

世界最大規模の小売店ウォルマートがOpenLaszloを採用

OpenLaszloとは、XMLとJavaScriptの記述からFlashのリッチテキストインターフェースを生成できるアプリケーションサーバー。プログラミングベースでリッチコンテンツが生成できるので、リッチコンテンツを用いたシステム開発で注目を集めています。

同じようなアプリケーションサーバーにはAdbe Flexがありますね。
Flexは商用でけっこういい値段がするんですが、OpenLaszloはオープンソース。導入コスト的にはLaszloが評価できますね。

どちらもだいぶ前に試用してみたことがありますが、基本的に同じようなことができます。記述に関してはFlexのほうが関数のラッピングが進んでてやや直感的にできたような気がしますが、イベント処理などはXMLとJavaScriptを組み合わせた独特の記述だったので少々とっつきが悪かったように記憶しています。まあどちらも初期バージョンだったので今はもっと便利になってるのかもしれませんが。

どちらもリッチコンテンツアプリケーションサーバーということで、最大の売りはFlashをゴリゴリ用いたWEBサイトが構築できるということ。OpenLaszloがリリースされた当時はAjaxが知られていなかったので、ドラッグアンドドロップでショッピングカートに追加みたいなことをしようと思ったらFlashだったわけです。しかしコーディング主体のシステム開発者から見たらFlashというデザインツールの要素が濃いソフトウェアでの開発はとっつきにくい感があります。Flashのシステム構築のノウハウを持っている技術者は今でもそれほど多くないのが現状。そこにつけてFlexやLaszloはコーディング主体でリッチコンテンツが生成できるとあって、ジャンルによってはかなり使われるんじゃないかな?と思っていたんですが大して使われてないですね。

Flexはコスト的に普及が難しいとしても、オープンソースであるLaszloが伸びない理由としては、単純に日本での認知度が低いからじゃないでしょうか。LaszloのターゲットはWEBシステム開発業界だと思います。しかし伝統的にFlashに対する関心が低いシステム開発者はLaszlo自体を知らない、対してFlashに詳しいWEBデザイン業界はFlash関連のツールだと知りながらもXML+JavaScriptというコーディング主体の開発ツールなのでアピールしづらい。結果としてニーズのエアポケットみたいなものに落ち込んでしまっているように思えます。

そういう感じでベンダー企業でもこれで提案できるところは極めて少ないんじゃないかと思います。そういう意味でウォルマートではどんなところが提案したのか、けっこう気になる感じです。で、そのウォルマートのサイトを見てみると、サイト全体がLaszloで開発されているわけではなく、プレゼンテーションとして重要な部分がLaszloでつくられているようです。

例えば、商品カテゴリのページではスライドバーで陳列商品が横にスクロールできたりします。これだけ見るとAjaxで開発することもできるようですが、これを定期的に違う機能を持つコンテンツに差し替えたりすることが前提であればLaszloにメリットがあるかもしれません。Laszloのデモを見るとサイト全体をFlash化しないといけないように思えてしまうんですが、このように部分的なリッチコンテンツの動的生成に使用するというアプローチは/.Jでも評されているように非常にクールな使い方だと思います。Flashの弱点としてのSEO対策関係はDHTMLでカバーし、プレゼンテーションで重要な部分のみをLaszloで作りこむ。こうすることで、Laszloセクションには最低限のアウトソーシングで済むのでそのセクションの技術コストが高いと仮定してもコスト的に見合う可能性が出てきます。WEB開発の中でこういったアプローチが一般的になると、Laszlo普及の活路が見えてくるかもしれません。

ボクの仕事的にもAjaxとOpenLaszloのメリットデメリットを明確にできれば開発提案の幅も広がるかと思いました。久しぶりにLaszloを評価してみたいと思います。

| | コメント (0) | トラックバック (0)

2006年10月30日 (月)

久々にいいマンガに出会いました

先日、ちょっとほしい本があったので久々に本屋に行きました。
ここんとこ情報収集といえばネットばかりで、欲しい本はアマゾンで買ったりしてたもんですから本屋に行くのはほんと久しぶりでした。

欲しい本はすぐ見つかったのですがすぐレジに行くのも何だな~と思いちょっとぶらぶらしてコミックのところを通りかかったとき、ひとつの本が目に入りました

リストランテ・パラディーゾ リストランテ・パラディーゾ

著者:オノ ナツメ
販売元:太田出版
Amazon.co.jpで詳細を確認する

最近気になっている作家のオノ ナツメさんの本。
この本も存在は知っててAmazonのウィッシュリストにはいってたりするんですが、いつか買おうと思っててそのままでした。

それが平積みにされていると何だか今買わないと損みたいな気持ちになるもんですねw勢いもあってそれも買ってしまい、家に帰ってから目的だった本はそっちのけでさっそく読みました。

あれです。
もしかしたら今まで読んだマンガのなかで一番好きかもしれません・・・

オノ ナツメさんの作品ははっきり言って女性向きです。
特にリストランテ・パラディーゾはいわゆる「紳士萌え」というなかなかマニアックなジャンルなんです。そういう趣向でありながら、絵柄やストーリーなどがほんとに気持ちよくて感動しました。ちなみにボクは「紳士萌え」どころかそっちの趣味はありませんよw

まあもともとレディースコミックなんかでも抵抗なく読んじゃうし、南Q太さんとか何冊か持ってたりするし、意外と女性マンガの表現は好きなんですけどね。このリストランテ・パラディーゾは恥ずかしげもなくブログに書きたくなるくらい感動したわけです。いいものに出会ったときには誰かに言わずにはいられませんよね。

この本、舞台がイタリアなので、イタリアに住んでみたいなーとか単純に思ってしまう自分がいます。たぶんこの気持ちは1週間は続きます。そして来週は何回かパスタをつくると思います。

こんな自分がけっこう好きですw

| | コメント (0) | トラックバック (0)

2006年10月29日 (日)

友人が会社を設立しました

CinnamonSpice LLC.
先日、東京の友人が会社を設立しまして、その社名です。
なんともおいしそうな名前ですな。
あれですか、香辛料の輸入業ですか?と絶対聞かれるに違いありませんが、WEB制作会社です。まあ、名前ならウチもよくシステム屋らしくないと言われるんですがねw

彼は大阪でフリーランスのWEBデザイナーをやっていましたが最近東京に行って某有名IT企業で働きながら会社設立の準備をしていました。先日会ったときに「10月中には会社たてたいです。」と話していましたが、無事達成できましたね。いや、有言実行すばらしい。有言実行率20%くらいのボクは見習わなければなりません。

そういえば最近のWEB制作業界はどうなんでしょうか。
ボクも元はと言えばWEBデザイナーとして大阪に出てきた身で、最近でもWEB制作の仕事を請けてはいますが、あまり最近の動向は詳しくありません。なんせ技術遷移のとても速い業界でして、ちょっと目を離すとなんだかわからないことになっていたりするんです。ここで言う「最近」は、半年くらいの期間ですよ。

WEBサイトというと一昔前は開発言語はHTMLと答えればよかったんですが、ここ1,2年来は違ってきました。今まで補助的に使われていた拡張のCSSやJavaScript果てはXMLなどを複雑に組み合わせたものがWEBサイトと呼称されているようです。

何のことだかわからない人も、「最近のホームページは見やすくなったし動きが多くなったなー、進歩してるなー」と感じたことがあるかもしれません。それは裏で動いている仕組みが非常に高度になったためなんです。特に近年新しい技術が開発されたり、昔からある技術を高度に組み合わせてより複雑な表現を可能にする試み等がされ、機能的に便利なホームページがリリースされるようになってきました。

そんな感じなのでITバブルが終わったとはいえ、WEB制作はまだまだこれから伸びる余地があると思います。ですが、反面で厳しい状況にもあると思うんですね。何が厳しいかというと、一つに技術を持っている人材の不足が言えるかもしれません。

先に書いたとおり、WEBのテクノロジーは非常に進歩が早いので、新しい技術を習得できたと思ったらもう次の技術がきてる、という感じが常にあります。日々業務をこなしていく中でそれらを隈なく習得しようかと思ったらけっこうな努力が必要ですね。ただでさえ拘束時間が長い制作業の中でそれを実現しようと思うとなおさらしんどいです。そういうわけで、WEBデザイナーという肩書きの人の中でも技術にバラつきがあるというのが現状です。腕はピンキリというわけですな。まあこれはSEでも同じなんですが。

CinnamonSpice LLCの若き代表 大西くんはWEB制作についてはかなりの勉強家でボクもいろいろ教えてもらったりもします。常に先を見据えて行動する感があるので、技術力と行動力で東京ではバリバリ仕事とってくるんじゃないかなーと期待しています。東京方面でWEB制作をお考えの方々は一度お考えいただければと思います。その際には是非「このブログを見てきた」と言ってください。ボクがメシでもおごってもらえるかもしれませんw

まあ冗談はさておき、会社設立おめでとう。
これからもご活躍をお祈りしております。

| | コメント (0) | トラックバック (0)

2006年10月28日 (土)

マイケル J フォックスさん

米国では中間選挙の最中だそうですが、ハリウッド俳優で現在パーキンソン病を患っているマイケルJフォックスさんがミズーリ州上院の民主党候補Claire McCaskill氏を応援するCMに出演し、話題になっているようです。

CMはYoutubeでもみることができますが、同候補を支持することが難病に苦しむ人々を救うことにつながるというようなアピールをされています。コメントの中でフォックスさんはよく身体を動かしていますが、これがパーキンソン病の特徴的な症例です。

彼はパーキンソン病との格闘の日々を綴ったLucky Manというベストセラー書を著したりと、この難病ついて熱心な活動を行っていることが知られています。今回のCMも活動の一環でしょうが、このように病状を明かして出演するというのはとても勇気のあることだと思います。

これについては、対立候補から「病気を売りにしている」と批判されている様子。しかし、毎度のことながらアメリカの選挙戦は対立候補の叩きあいがすごいですな。スピーチもドキュメントもまず相手をけなすことから始まるのが普通みたいです。

これはもう一種のエンターテイメントだと思います。
「けなしあいに勝ったほうが強い」ということなんでしょうか。筋肉質な国ですなあ。

| | コメント (0) | トラックバック (2)

2006年10月27日 (金)

ありがとう新庄さん

日本ハム 日本一おめでとうございます。
そして、新庄さんほんとうにありがとう。

新庄さんの野球はほんとに楽しかったですね。
ボク的にはやはり阪神の頃のイメージが強いんですが、日ハムからの野球はさらに素敵でした。

もし一日誰かと人生が変われるとしたら、新庄さんと変わってみたいですな。
そんな人です。ほんとに素敵な人だと思います。

もう一度、新庄さんありがとう!
これからも何やるかわからないですが、がんばってください。

| | コメント (0) | トラックバック (1)

2006年10月21日 (土)

円ドル表示ガジェット修正します

このガジェットの最新版はこちらです

以前、Googleデスクトップ - ドル円レートを表示してみるという記事で作成したガジェットですが、軽い気持ちでGoogleデスクトップのガジェットライブラリに登録してみたところ意外に多くの方にダウンロードしてもらっているようです。ありがとうございます。そしてごめんなさいm(_ _)m

なんでごめんなさいかというと、最近ちょっと表示が不安定になってるみたいです。原因はレート取得元のサイトであるロイタージャパンのページのソース変更が結構頻繁にあるみたいで、変更後のソースを正常に解釈できなくていつまでたっても「接続中」と表示されたままになるみたいです。

いや、このガジェットはGoogleデスクトップをブログネタにしたいためにちょっとつくってみた程度のものだったので、たいして深く考えてなかったし検証も十分じゃなかったです。そんなのを勢いあまってライブラリに登録したボクが悪いですね。インストールしたけどちゃんと動かなかった方々ごめんなさい。

一応、現在は修正版をアップロードしています。取得元をロイターからYahooファイナンスに変えました。もともとはYahooファイナンスから取得してたんですけど、レート情報の更新がロイターのほうが速いみたいだったのでロイターにしてたんです。Yahooファイナンスからの取得ロジック残しといてよかった・・・。

現在インストールして動かない方は、いったんガジェットをツールバーから削除して、マイドキュメントの中のGoogleガジェット フォルダの 円-ドル レート表示-Muraoka Masakazu.gg を削除し、サイドバーの追加ボタンで再インストールしてください。

さて、とりあえず修正したんですが、ちょっと不安も残るし少なからずユーザーもいらっしゃるみたいだし。このガジェットもう少しマジメに考えて改造してみようかと思います。現在はこれを作ったときほど時間に余裕がないのでいつになるかわからないんですが、ある程度しっかり動かさないと失礼ですしね。

それに少し前知ったのですがGoogleでbathtimefishを検索すると、未だ作成中の自分ページ以外は、全て各国のGoogleガジェットの紹介ページがヒットしてます。これはこれで微妙なSEO対策ですなw

こんなこともあるのでやっぱりちゃんとしないといけないなぁ。
とりあえずヒマをみつけてぼちぼちやっていこうと思います。

| | コメント (2) | トラックバック (0)

2006年10月13日 (金)

玄箱 - MUSASHIをつかってみる

前回、玄箱にMUSASHIをインストールしてみたわけですが、さて玄箱のスペックでMUSASHIが満足に使えるものなのかどうか不安なところです。ということで、ちょっと大きなデータをMUSASHIで処理してみましょう。

まず、データをどうするかですがMUSASHIサイトの人工データのリンクを参考にして、データを生成するというのが有効かと思いましたが、ちょっと興味本位で現実に存在するデータをいじってみたくなりました。で、ここではパッと思いついた郵便番号のデータを使おうと思います。全国一括データ約12万件を利用します。

ken_all.lzhをダウンロードして展開すると、ken_all.csvは121693件のデータでした(2006.10.13現在)動作テストするには十分な量だと思います。このCSVに対してテキストエディタの置換などを使ってダブルクォーテーション(")を削除します。そして、一番先頭に次のヘッダを追加します。

===
全国地方公共団体コード,旧郵便番号,郵便番号,都道府県名,市区町村名,町域名,都道府県名,市区町村名,町域名,一町域が二以上の郵便番号で表される場合の表示,小字毎に番地が起番されている町域の表示,丁目を有する町域の場合の表示,一つの郵便番号で二以上の町域を表す場合の表示,更新の表示,変更理由
===

追加したら、文字コードEUCで上書き保存します。
玄箱はデフォルトでEUCですが、他の文字コードを利用している場合は環境に合わせて変更してください。

データの準備ができたら、FTP等で玄箱にアップロードします。

では、玄箱に接続してみましょう。
とりあえずCSVファイルをみてみます。

---
$ head KEN_ALL.CSV
全国地方公共団体コード,旧郵便番号,郵便番号,都道府県名カナ,市区町村名カナ,町域名カナ,都道府県名,市区町村名,町域名,一町域が二以上の郵便番号で表される場合の表示,小字毎に番地が起番されている町域の表示,丁目を有する町域の場合の表示,一つの郵便番号で二以上の町域を表す場合の表示,更新の表示,変更理由
01101,060  ,0600000,ホツカイドウ,サツポロシチユウオウク,イカニケイサイガナイバアイ,北海道,札幌市中央区,以下に掲載がない場合,0,0,0,0,0,0
01101,064  ,0640941,ホツカイドウ,サツポロシチユウオウク,アサヒガオカ,北海道,札幌市中央区,旭ケ丘,0,0,1,0,0,0
01101,060  ,0600041,ホツカイドウ,サツポロシチユウオウク,オオドオリヒガシ,北海道,札幌市中央区,大通東,0,0,1,0,0,0
01101,060  ,0600042,ホツカイドウ,サツポロシチユウオウク,オオドオリニシ(1-19チヨウメ),北海道,札幌市中央区,大通西(1~19丁目),1,0,1,0,0,0
01101,064  ,0640820,ホツカイドウ,サツポロシチユウオウク,オオドオリニシ(20-28チヨウメ),北海道,札幌市中央区,大通西(20~28丁目),1,0,1,0,0,0
01101,060  ,0600031,ホツカイドウ,サツポロシチユウオウク,キタ1ジヨウヒガシ,北海道,札幌市中央区,北一条東,0,0,1,0,0,0
01101,060  ,0600001,ホツカイドウ,サツポロシチユウオウク,キタ1ジヨウニシ(1-19チヨウメ),北海道,札幌市中央区,北一条西(1~19丁目),1,0,1,0,0,0
01101,064  ,0640821,ホツカイドウ,サツポロシチユウオウク,キタ1ジヨウニシ(20-28チヨウメ),北海道,札幌市中央区,北一条西(20~28丁目),1,0,1,0,0,0
01101,060  ,0600032,ホツカイドウ,サツポロシチユウオウク,キタ2ジヨウヒガシ,北海道,札幌市中央区,北二条東,0,0,1,0,0,0
---

データが正常なのを確認したら、MUSASHIのcsv2xtコマンドでxmlTableに変換します。

---
$ csv2xt -F -i KEN_ALL.CSV -o zip.xt
#END# 27942 2006/10/13 11:17:54 "csv2xt -F -i KEN_ALL.CSV -o zip.xt" in=121692 out=121692
---

csv2xtは、名前のとおりCSVファイルをxmlTable形式に変換するコマンドです。
xmlTableはMUSASHIがデータ処理に使うフォーマットです。

さて、かなり時間がかかるに違いないと思いキー入れたらお茶でも淹れようと席を立ちかけたんですが、この処理は10秒程度で終わってしまいました。思ったよりかなり高速です。これはもしかしたら普通に仕事で使えるかも?と期待が出てきたのでお茶はあとまわしにして、処理を続けてみましょう。

zip.xtの中身は以下のようになっています。

---
$ head -25 zip.xt
<?xml version="1.0" encoding="euc-jp"?>
<xmltbl version="1.1">
<header>
<field no="1" name="全国地方公共団体コード"></field>
<field no="2" name="旧郵便番号"></field>
<field no="3" name="郵便番号"></field>
<field no="4" name="都道府県名カナ"></field>
<field no="5" name="市区町村名カナ"></field>
<field no="6" name="町域名カナ"></field>
<field no="7" name="都道府県名"></field>
<field no="8" name="市区町村名"></field>
<field no="9" name="町域名"></field>
<field no="10" name="一町域が二以上の郵便番号で表される場合の表示"></field>
<field no="11" name="小字毎に番地が起番されている町域の表示"></field>
<field no="12" name="丁目を有する町域の場合の表示"></field>
<field no="13" name="一つの郵便番号で二以上の町域を表す場合の表示"></field>
<field no="14" name="更新の表示"></field>
<field no="15" name="変更理由"></field>
</header>
<body><![CDATA[
01101 060__ 0600000 ホツカイドウ サツポロシチユウオウク イカニケイサイガナイバアイ 北海道 札幌市中央区 以下に掲載がない場合 0 0 0 0 0 0
01101 064__ 0640941 ホツカイドウ サツポロシチユウオウク アサヒガオカ 北海道 札幌市中央区 旭ケ丘 0 0 1 0 0 0
01101 060__ 0600041 ホツカイドウ サツポロシチユウオウク オオドオリヒガシ 北海道 札幌市中央区 大通東 0 0 1 0 0 0
01101 060__ 0600042 ホツカイドウ サツポロシチユウオウク オオドオリニシ(1-19チヨウメ) 北海道 札幌市中央区 大通西(1~19丁目) 1 0 1 0 0 0
01101 064__ 0640820 ホツカイドウ サツポロシチユウオウク オオドオリニシ(20-28チヨウメ) 北海道 札幌市中央区 大通西(20~28丁目) 1 0 1 0 0 0
---

ちゃんと変換されているみたいですね。xmlTable形式については他にドキュメントがあるので調べてみることをおススメします。

では次に、集計に必要な項目を抜き出してみます。項目の選択はxtcutを使います。

---
$ xtcut -f 全国地方公共団体コード,郵便番号,都道府県名 -i zip.xt -o test1.xt
#END# 16235 2006/10/13 11:31:10 "xtcut -f 全国地方公共団体コード,郵便番号,都道府県名 -i zip.xt -o test1.xt" in=121692 out=121692
---

test1.xtを確認します。

---
$ head test1.xt
<?xml version="1.0" encoding="euc-jp"?>
<xmltbl version="1.1">
<header>
<field no="1" name="全国地方公共団体コード"></field>
<field no="2" name="郵便番号"></field>
<field no="3" name="都道府県名"></field>
</header>
<body><![CDATA[
01101 0600000 北海道
01101 0640941 北海道
---

全国地方公共団体コード、郵便番号、都道府県名が切り出されています。
xtcutも2~3秒で終わりました。非常に高速です。

次に、都道府県ごとの郵便番号数を集計してみます。
集計はxtaggで行います。

---
$ xtagg -k 都道府県名 -f 郵便番号:郵便番号数 -c cnt -i test1.xt -o test2.xt
#END# 23059 2006/10/13 11:41:29 "xtagg -k 全国地方公共団体コード -f 郵便番号:郵便番号数 -c sum -i test1.xt -o test2.xt" in=121692 out=1973
---

これも2秒程度で終わりました。
中身は

---
$ head -20 test2.xt
<?xml version="1.0" encoding="euc-jp"?>
<xmltbl version="1.1">
<header>
<field no="1" name="全国地方公共団体コード"></field>
<field no="2" name="郵便番号数"></field>
<field no="3" name="都道府県名" sort="1"></field>
</header>
<body><![CDATA[
23101 6876 愛知県
38201 1734 愛媛県
08201 2818 茨城県
33201 2182 岡山県
47201 790 沖縄県
03201 1934 岩手県
21201 3340 岐阜県
45201 876 宮崎県
04101 3281 宮城県
26101 6657 京都府
43201 1865 熊本県
10201 1502 群馬県
---

こんな感じですね。ちょっとわかりやすくするためにxtsortで郵便番号数で降順ソートしてみましょう。

ソートのついでに全国地方公共団体コードはいらないので削除したいです。xtcutで郵便番号数と都道府県名を切り出します。

これらの処理を一括して行いたい場合はパイプを使って記述します。シェルなどで高度な集計プログラムを作る場合は、このパイプでの一括処理が強力です。

ソートと項目選択の記述は以下のようになります。

---
$ xtsort -k 郵便番号数%nr -i test2.xt | xtcut -f 郵便番号数,都道府県名 -o test3.xt
---

test3.xtは以下のようになります。

---
$ head -20 test3.xt
<?xml version="1.0" encoding="euc-jp"?>
<xmltbl version="1.1">
<header>
<field no="1" name="郵便番号数" sort="1" numeric="1" reverse="1"></field>
<field no="2" name="都道府県名"></field>
</header>
<body><![CDATA[
8205 北海道
6876 愛知県
6657 京都府
5351 新潟県
5200 兵庫県
3909 福島県
3732 大阪府
3529 千葉県
3340 岐阜県
3333 東京都
3281 宮城県
3256 福岡県
3237 富山県
---

これで、「全国郵便番号が多い都道府県ランキング」ができましたw
データをみると、北海道が一位ですね。やはり土地面積が大きいからでしょうか。単純に考えれば面積が大きい県ほど郵便番号が多いと思われますが、面積が小さくても人口密度が高くて居住区画の割り方が細かいところは郵便番号が多くなるはず。大阪や東京が高い順位にきているのはそのせいかもしれません。

都道府県別の土地面積や人口、人口密度などのデータを組み合わせれば、面白い分析ができるかもしれません。単にスピードテストのつもりで郵便番号データを使用しましたが、やってみると発見があるものですな。これがデータ分析の面白いところだと思います。

さて本題に戻すと、玄箱でのMUSASHIは正常に動作し、しかも処理速度は実用に耐えるレベルであるということがわかりました。これはほんとに仕事で使えそうですねえ。でもボク自身MUSASHIは勉強中なのではやくいっちょまえに使えるようになってブログでもMUSASHIを使ったデータマイニングを紹介できればいいなあと思っています。
ガンバルガー!

| | コメント (0) | トラックバック (0)

2006年10月 7日 (土)

玄箱 - MUSASHIをインストールしてみる

MUSASHIは、データマイニングで必要なデータ処理を行うためのコマンド群です。
最近データマイニングを勉強しているので、データマイニングツールがほしいと思っているんですが、データマイニングツールってとても高価なのです。もうボクには当然買えませんというような額なんですが、このMUSASHIはオープンソースで、且つボクの好きなコマンドライン操作でもってデータ処理ができるというすばらしいソフトです。

MUSASHIはLinux環境で動作するため、玄箱にインストールしてみようかと思いました。しかし大量データ処理用のソフトなので、果たして玄箱のハードスペックで足りるのかどうか疑問です。

そんなこともあって、最初Cygwinに入れてみたんですが、文字コードの問題等でちょっと使用感が悪いなという感じだったので、まあどれくらい処理してくれるものか気にもなったので試しに玄箱Debian環境にインストールしてみることにしました。

MUSASHIのインストールにはncursesとlibxml2が必要です。

nucursesがない場合はインストールします。

---
# aptitude install ncurses
---

次にlibxml2をインストールします。

---
# aptitude install libxml2 libxml2-dev
---

コンパイルにはC++を使うので、ない場合はインストールしておきましょう。

---
# aptitude install g++
---

http://musashi.sourceforge.jp/
よりMUSASHIとモジュール類の最新版をダウンロード。
現行では

musashi-core-1.0.4.tar.gz
musashi-man-20041206.tar.gz
musashi-module-20041206.tar.gz
musashi-scenario-20041206.tar.gz
musashi-check-20041206-2.tar.gz

となっています。

まず、coreを展開してconfigure make make installします。
---
# tar zxvf musashi-core-1.0.4.tar.gz
# cd musashi-core-1.0.4
# ./configure
# make
# make install
---

setdocenc.shを実行してからconfigure、make、install。
---
$ ./setdocenc.sh
$ ./configure
$ make
$ make install
---

インストール後コマンドヘルプを表示して文字出力を確認します。

---
# xtcut -h
NAME:
xtcut version: 1.2 項目の選択

USAGE:
xtcut -f 抜き出す項目名リスト [-r] [-i 入力ファイル名] [-o 出力ファイル名] [-z] [-t]

SUMMARY:
項目リストで指定した項目を、その順番で選択する

OPTION:
-r: 項目削除
-z: 標準出力の圧縮
-t: plain text

EXAMPLES:
xtcut -f 顧客,数量,金額 -i dat.xt -o rsl.xt
xtcut -f 顧客,数量,金額 -r -i dat.xt -o rsl.xt

INFORMATION: <http://musashi.sourceforge.jp>
BUG  REPORT: <musashi-users@lists.sourceforge.jp>

#
---

次に、manをインストールします。

---
# tar zxvf musashi-man-20041206.tar.gz
# cd musashi-man-20041206
# ./Install.sh
---

次にmoduleをインストールします。

---
# tar zxvf musashi-module-20041206.tar.gz
# cd musashi-module-20041206
# ./Install.sh
---

インストールが終わったらsampleディレクトリのサンプルを実行してみます。

---
# cd sample
# ./abc.sh
# ./mvavg.sh
---

sample/outdatに実行結果が出力されるので、確認します。

次に、scenarioをインストールします。

---
# tar zxvf musashi-scenario-20041206.tar.gz
# cd musashi-scenario-20041206
# ./Install.sh
---

テンプレートスクリプトをsampleにコピー

---
# ./InstallTmp.sh
---

サンプルを実行してみます。

---
# cd sample
# ./mssRFM_tmp.sh
---

最後に各コマンドの動作確認スクリプトmusashi-checkの実行です。

---
# tar zxvf musashi-check-20041206.tar.gz
# cd musashi-check-20041206
---

check.shを実行します。これによりほぼ全てのMUSASHIスクリプトについて動作チェックが行われます。

---
# ./check.sh
---

チェック終了後に同ディレクトリに生成されるlogファイルに対してNGやERRがないか検索します。

---
# cat log | grep -E 'ERR|NG'
---

なければ、コマンドはすべて正常に実行されています。
エラーがあれば、同ディレクトリのdiffListファイル内のエラー内容をチェックしてみてください。

エラーがなければ終了です。

サンプルコマンドを実行したりしてみましたが、思ったより処理速度が速いです。データ保存に十分な空き容量さえあれば玄箱でもデータマイニング作業ができるかもしれません。少なくとも、お勉強のための環境ということなら十分だと思いました。

企画をお客様に提案するときなんかでも、提案の根拠となるデータは必要で、そのためのデータ分析ってのがけっこう成功の鍵になってたりするわけです。データの分析手法も様々あるんですが、分析のためのデータ整理にはけっこう手間がかかるんですよね。

MUSASHIみたいにデータマイニングに特化したソフトで大量のデータを素早く処理できるのは仕事上かなりありがたいです。MUSASHIも触り始めたばかりなのでこれからなんですが、もう少し勉強してから記事にもしていこうと思います。

| | コメント (0) | トラックバック (0)

2006年10月 6日 (金)

Googleでソースコード検索

/.Jの記事によると、Googleがソースコード検索サービスを公開したとのことです。
Google Code Search というサービスで、サイトに公開されているソースコードの文字列を検索できるとか。正規表現が使えるとか、ファイルや言語の種類を指定するオプションがあるなど、開発者の検索目的に合った機能があるようです。

GoogleLabで提供されているサービスについては、以前もウェブサイトの公共性という記事のなかで視覚障害者向け検索サービスGoogle Accessible Searchを紹介しましたが、ほんとニーズの洗い出しがうまいと思います。記事をみてはっと気付きましたが、最近コードを書いていて、メソッドを調べたり処理のテンプレートを調べたりする場合はほとんどWEB検索で完結しています。「~リファレンス」みたいな電話帳くらいの本を開くことはほとんどなくなりましたね。時代を感じます。

Google Code Searchみたいなサービスが出てくると、ますます本を紐解くことは少なくなるような気がしますね。それでもついつい「~リファレンス」買っちゃうんですけどね。場合によってはWEBよりも本で調べるほうが早いこともあるし、つれづれ読んでいると付帯的に知識がつくのは本の大きなメリットだと思います。WEB検索、Google Code Search、リファレンス本という3つのツールの使い分けになるかも。それくらいパワフルであってほしいですな。

とりあえず紹介だけでもアレなんで、ちょっとGoogle Code Searchで遊んでみようと思います。キーワードstrcatを含むC言語ファイルで検索してみました。キーワードについて深い意味はありません。strcatってなんとなくひびきが好きなんですよw

検索してみるとトップにlinux-2.4.33.3/lib/string.c が出てきました。strcatを使ったプログラムのソースコードが出てくるかと思いきや、なるほどstrcatそのもののソースが出てきました。まあそりゃそうかもね。他にもOpenSSLやglibcなどが高い位置に上がっているのはそれだけ検索ニーズがあるってことなんでしょうね。そういうことにもなるほどなーと感心します。

まあとりあえずブックマークしといて、しばらく使ってみようかなってところですね。

| | コメント (0) | トラックバック (0)

2006年10月 4日 (水)

Cygwin - CygTermをつかってみる

最近はLinux系で遊ぶときは玄箱Debianばかり使っていますが、玄箱を知る前はCygwinを多用していました。Cygwinはずいぶん前から使っていて初期のころからいろんなソフトをコンパイルしてみては試行錯誤してみたものです。大半がうまくいかなかったですけどね(笑)

玄箱Debianがウチで稼動するようになってからはCygwinのコンソールを開くことなどほとんどなくなりましたが、端末にはインストールされていてパスまで通っています。DOSプロンプトを操作するときに思わず ls なんて打ってしまうので、主にそれ対策です。

そんな感じでウチではなりを潜めていたCygwinなのですが、ちょっと用事があって久々に使ってみたくなりました。改めて考えてみればCygwinはWindows上で動くUNIXエミュレータとしては非常にパワフルで使いやすいです。対応ソフトウェアも幅広く今ではGnomeまで動くので、windowmakerやblackboxをやっとのことで起動させていた一昔前に夢だったことが今では当たり前になっているのが感慨深いですね。

そんなCygwinですが、玄箱との住み分けを考えてみると、ハードスペックの差を中心に考えた使い分けになるでしょうかね。PowerPC266MHz、RAM128Mという玄箱HGのスペックは小規模ネットワーク内のWEB、メールサーバー等でならなんとかなると思います。しかし、大量のデータ処理や高負荷テストなどでは役不足な感があるのでそういう場合はWindowsPCのハードスペックを使えるCygwinが選択肢として有効かもしれません。

もちろん、Linuxマシンが買える余裕のある方はCygwinなんか使わずにそちらを使うべきなんですけどね。玄箱を買うのがやっとなボクのような貧乏人の選択肢です(笑)

前置きが長くなりましたが、今回はCygwinをEUC環境で難なく使うための手法を紹介してみます。Cygwin上でアプリケーションをmakeして使用するときなど、アプリケーションの多くはEUCを規定として動作します。Windowsは当然SJISなのでこの仕様の差がいろいろ使いにくい状況を発生させます。

この問題を回避するため、CygTermというソフトを導入して、TeraTermでCygwinに接続するという方法をとります。玄箱を使うためにTeraTermを使っている人は同じような感覚でCygwinが使えますね。

まず、サイトからCygTermのソースコードをダウンロードしてきます。
現行バージョンは1.06です。

ファイルを展開して、ディレクトリに移動します。

---
# tar xzvf cygterm106.gz
# cd cygterm106
---

MakefileのBINDIRを編集してインストール先を変更します。
ここでは/usr/local/binにインストールするため

===
BINDIR = /usr/local/bin
===

としました。
編集後、make installします。

---
# make install
---

コンパイルエラーが出る場合は、MakefileのCFLAGSを以下のように変更して、再度make installしてください。

===
CFLAGS = -O2 -fno-exceptions -Xlinker --allow-multiple-definition
===

正常にインストールできたら、/usr/local/bin下にcygterm.exeとcygterm.cfgができています。cygterm.cfgを以下のように編集します。

===
TERM = C:\program files\teraterm\ttermpro.exe %s %d /F=C:\cygwin\usr\local\bin /KR=EUC /KT=EUC
#TERM = telnet.exe %s %d
TERM_TYPE = vt100
PORT_START = 20000
PORT_RANGE = 40
SHELL = /bin/bash
ENV_1 = MAKE_MODE=unix
ENV_2 = HOME=/home/
===

次に、C:\Program Files\teraterm\TERATERM.INI を C:\cygwin\usr\local\binにコピーします。コピーしたTERATERM.INIを開いて以下の部分を確認します。

===
[TTSSH]
; SSH enabled flag(1=enabled 0=disabled)
Enabled=0
===

Enabled=0の場合はいいですが、1の場合は0に変更してください。

設定が終わったら、cygterm.exeを起動します。
Teratermが起動してCygwinのコンソールが表示されれば成功です。

せっかくなので、Teratermから日本語入力できるようにしておきましょう。

.inputrcを開いて以下を追加します。

===
set input-meta on
set output-meta on
set convert-meta off

===

Teratermを終了して再度cygterm.exeを起動すると変更が反映されます。

| | コメント (0) | トラックバック (0)

2006年10月 2日 (月)

玄箱 - 日本語環境を構築してみる

さて、今後何かといじったりするのに便利だと思うので日本語の入出力ができるようにしておきましょう。

最近の流行ではUTF-8みたいなんですが、過去の資産とか今後やりたいこととか後からめんどくさいことになったらいやだなとかいろいろありますので、とりあえずスマートに使うためEUCで日本語環境をつくってみます。UTF-8が必要になったら後から考えるということで。

まずは必要なモジュールをインストールします。

---
# aptitude install language-env canna freewnn-jserver skkserv canna-utils
---

Configuring Locales画面ではja_JP.EUC-JPを選択し<ok>します。
defaultもja_JP.EUC-JPを選択して<ok>します。

dpkg-reconfigure で再設定します。

---
# dpkg-reconfigure -plow locales
---

Configuring Locales画面ではja_JP.EUC-JPを選択し<ok>します。
defaultもja_JP.EUC-JPを選択して<ok>します。

ルートからユーザにチェンジし、ユーザの文字コードを設定します。

---
$ user-ja-conf
---

質問にはほとんどデフォルトで答えておきます。
漢字変換はCannnaにしておきます。

ルートに戻って、user-ja-confで指定された推奨パッケージをインストールします。

---
# aptitude install ja-trans, jless, kterm, egg, emacs21, xemacs21-mule-canna-wnn
---

ついでにjvimをインストールしときます。
---
# aptitude install jvim-canna
---

jvimを規定のエディタにしたいので.bashrcに設定を追加します。

.bashrc
===
# 標準エディタを vi にする。Debian Policy Manual 参照
alias vi='/usr/bin/jvim'
EDITOR=vi
export EDITOR
===

いったんログアウトして再接続すると、設定が有効になります。

ボクはemacsよりviが好きなので上記の設定でviコマンドをjvimに代替しておきました。
これでviと打つとjvimが起動し、日本語表示がばっちりなわけです。

とりあえずこれで日本語化は終わりました。
コマンドラインのレベルで日本語を扱うことは少ないかと思いますが、後日何かやってみようと思います。

| | コメント (0) | トラックバック (0)

2006年10月 1日 (日)

大阪市内も緑化してもらいたいもの

六本木ヒルズで稲刈り

緑化にかなり気合が入っている六本木ヒルズですが、まさか水田まであったとは。
そういう仕掛けは非常にうまいなと思います。福井県もよいアピールになったと思いますよ。

何かと都市緑化でアピールされる六本木ヒルズですが、改めて調べてみると計画当初から緑化に注力していたようです。難しいことはわかりませんが、先進的ですね。今後こういったノウハウが都市緑化技術をリードしていくんじゃないでしょうか。世界の大都市東京の中でのこういった取り組みはとても意義があるような気がします。

さて、地元に目を向けて大阪なんですが、大阪も日本を代表するヒートアイランドでして、なんとも暑いです。今はだいぶ涼しくなって過ごしやすくなってきましたが、先月までは夜もろくに眠れない熱帯夜が続き、何年も住んでますがうんざりします。

ヒートアイランドな原因は、クーラーの排熱とかなんでしょうけど、大阪市内は緑が非常に少ないことにもよると思います。ほんと少ないですよね。東京は首都高速乗っていて明治神宮あたりの緑が見えてくるとなんとなく気が和む感じですが、大阪ではそういう場所がありません。大阪城周辺には少し緑がありますが、あまり気にとまらないんですよね。なぜかな?

ともかく、大阪市内にはもっと緑を増やして欲しい。以前も書いたような気がするけど、屋上緑化をもっと進めたらどうかなと思います。で、大阪市内の主要な百貨店やビルなどの屋上はどうなっているのかなと軽く調べたところ、緑っぽいものがあるのは阪急百貨店心斎橋そごうだけでした。NUとかE-maとか最近できたビルなんかには何の配慮もなされていない様子。屋上がどうなってるか知らないですが、空いてるんだったら木でも植えたらどうかと思います。

そういえば、最近はファッションビルの入り口なんかによくプラントショップが並んでるようになりました。緑は集客効果があるってことなんでしょうかね?そうだとしたら今後屋上緑化なんかも集客につながる可能性もあるんじゃないでしょうか。せっかくなんでその辺考えてほしいです。

調べてたら大阪のヒートアイランド対策っていうページにあたりました。2025年までになんて気の長いこと言わないでさっさと動いてほしいなと思いました。大阪人はなんでも早いのがすきやん!

| | コメント (0) | トラックバック (0)

« 2006年9月 | トップページ | 2006年11月 »