- 締切済み
htmlを解析するプログラムに最適な言語は?
友人から「価格comへアクセスしにいってその情報をテキ ストデータに落としこむみたいな事をしたいのだが、ど のプログラミング言語がいいと思う?」と質問されたの ですが、どのプログラミング言語がお勧めでしょうか? よろしくお願い致します。
- みんなの回答 (3)
- 専門家の回答
みんなの回答
- tyozuikou
- ベストアンサー率100% (6/6)
回答No.4
テキストのデータを分析すれば、regular expressionを使うのは一番便利だと思います。価格はHTMLの固定な要素とか属性値とかに含まれているので、自分が考えて最適なregular expressionを構造したほうがいいです。
- neuron-x
- ベストアンサー率52% (139/266)
回答No.2
独自にパーサー(解析器)などを作成するなら別ですけど、HTMLを簡単に扱いたいのであれば豊富に存在しているライブラリを利用すれば良いと思います。 私なら、一番慣れているC#にHTML Agility Packというオープンソースのライブラリを使って開発すると思います。HTML Agility Packは、HTMLに対してXPathが利用できるのでとても便利です。 http://htmlagilitypack.codeplex.com/ XPathについても情報がたくさんあるので、Googleなどで検索してみてください。
- kmee
- ベストアンサー率55% (1857/3366)
回答No.1
私ならPerlを選びますが、その一番の理由は「使い慣れているから」です。 そのご友人がどれくらいの実力かがわからないのですが もともとプログラミングスキルの高い人なら、必要な機能を簡単に作れる言語を一から勉強してもそれほど時間はかからないでしょう。 ですが、技術が無いのなら、今使用できる言語でのやり方を探した方が早いでしょう。