- 締切済み
ホームページ上の文字を表にするのは可能不可能
- みんなの回答 (8)
- 専門家の回答
みんなの回答
- sugimotoasuna
- ベストアンサー率0% (0/0)
ScrapeStormと言うWebスクレイピングツールを試してください。
- imogasi
- ベストアンサー率27% (4737/17069)
コンピュターソフトの技術的なこと(可能かどうか)を聞いているのか? プログラムで処理したいということか? ーー 中身的な情報やデータのことが知れば済むなら、 電車の時刻表は数社のものがWEBにある場合が多く、 別途 「eitan]があったので、新幹線時刻表、名古屋ー下りで出る表をコピーして、エクセルのシートに張り付けて、列幅を調整すれば、エクセルのシートの表になったよ。 そのまたコピーを張り付けると下記。 06時 06:20→09:39 3時間19分 のぞみ75号 博多 停車駅 06:36→10:11 3時間35分 ひかり531号 博多 停車駅 07時 07:06→10:24 3時間18分 のぞみ77号 博多 停車駅 ・・・ ーーー HTML文のテーブルを解析するも良いが、最近は、見てくれで表でも、 https://www.sejuku.net/blog/49377などにのっている、古典的なTAGで作られている表だと断定できないようだ。 よほど今後勉強しないと、無理で、時間が掛かると思う。 少し勉強してれば、こんなことは知っていると思うが。
- dragon-man
- ベストアンサー率19% (2712/13696)
ホームページはHTMLと言う言語で書いた表記です。ブラウザで表示すると、一見エクセルと同じように見えますが、まったく違うものです。貼り付けても駄目です。
- kkkkkm
- ベストアンサー率66% (1734/2604)
メモ帳にいったん貼り付ける メモ帳で全てコピーする エクセルに貼り付ける データタブの区切り位置を選択 カンマやタブなどの・・・ を選択 次へ 区切り文字でスペースにチェック 項目ごとに区切り線が入ったら完了
- AsarKingChang
- ベストアンサー率46% (3467/7474)
もう一つ、 「そのサイト」の内容って、 そのサイト以外でも公開されてる気がする。。 そのサイトがダメなら、ほかのサイトでも、 試してみる方が、もしかしたら早い気がしてきた。 時刻表なら、かなり多くのサイトがシェアしてるか API通信で表示してると思われるので。
- AsarKingChang
- ベストアンサー率46% (3467/7474)
最近のHTMLでは、TABLE命令をあまり書かず、 float:left;などで横につなげた li などで幅を決め打ちして、位置をあわせてるコンテンツが多いので、 他のソフトから見ると、どうしても「表」にはならない事がおおいですね。 次のアプローチは、そのサイトの表示物が 何らかのAPI経由で持ってこれるものか?を調査 それを外部から叩いてもレスポンスが得られるなら、 かなりいい結果になる可能性あり! JSなどで自分でお好きな配置にしてしまえば なんとでもなる! なんなら、エクセルのマクロとして内部スクレイピングに してしまうなんてのもあり! それが出来ない場合は、 まともにコピペしたものを再成形しかないので、 ややこしいが、それが限界かな~と思います。 (なお、サイトによりコピペを禁止してるケースもあるので、 あくまで、元サイトがそれをやっていいという設定ある前提) などでどうでしょうか? どっちにしても、「なければ作れ!」の延長にしか ならないとは思いますが。
- q4330
- ベストアンサー率27% (768/2786)
誤字が多いので書き直し どこのサイトですか? URLを書いてくれると試せるのですが... https://finance.yahoo.co.jp/quote/3808.N/history ここの時系列データーをマウスで選択しExcelに張り付けたのが下の写真です セルにきれいに収まっています。 マウスで選択「Ctrl+C」でコピー、Excelに移り「A1」セルを選択後に「Enter」と操作しました
- q4330
- ベストアンサー率27% (768/2786)
どこのサイトですか? URLを書いてくれると試せるのですか? https://finance.yahoo.co.jp/quote/3808.N/history ここの時系列データーをマウスで選択しWxcelに張り付けたのが下の写真です セルにきれいに収まっています。 マウスで選択「Ctrl+C」でコピー、Excelに移り「A1」セルを選択後に「Enter」と操作しました