大量のPHPファイルからタイトルだけを抽出する方法

このQ&Aのポイント
  • ホームページリニュアル作業のため、PHPファイルからタイトルを抽出する方法を探しています。
  • HTMLのタイトルとURLを抽出するソフトを見つけましたが、PHPファイルの場合はHTMLに変換する必要があります。
  • PHPファイルからタイトルとURLを抽出する方法があれば教えてください。
回答を見る
  • ベストアンサー

大量のPHPファイルからタイトルだけを抽出したい

ホームページリニュアル作業を行うべく、 いったんサーバーからデータを全てダウンロードし、 エクセルに各ページURLを並べ、整理しようと思ったのですが、 URLだけでは判別しにくく、各ページタイトルも必要となりました。 HTMLのタイトルとアドレスを抽出するソフトを見つけることはできたのですが、 私のリニュアルしようと思っているHPは、すべてPHPでできているのです。 このソフトを使用するには、全ページ(300程度)、PHPをHTMLにしなければならないようなのですが、そのようなことができるのでしょうか? もしできないようでしたら、大量のPHPデータからタイトルとURLを抽出することができるような方法がありますでしょうか。 どうかお力をお貸し下さい。

  • PHP
  • 回答数1
  • ありがとう数3

質問者が選んだベストアンサー

  • ベストアンサー
  • BLUEPIXY
  • ベストアンサー率50% (3003/5914)
回答No.1

IEオブジェクトを使ってA列のA2以下のセルにURLが入力されているアドレスのタイトルとか更新日付を取ってくるエクセルのマクロです。 アドレスをIEを使って読み込んでいるので、PHPかどうかは関係ないです。 遅いですが、とりあえず、使えると思います。 ------------------------------------------ Public Sub ReadTitle() Dim IE Dim url As Range Dim i As Integer Set url = Range("A2") Set IE = CreateObject("InternetExplorer.Application") i = 0 Do While (url.Offset(i, 0).Value <> "") IE.Navigate (url.Offset(i, 0).Value) While IE.busy: Wend While IE.Document.readyState <> "complete": Wend url.Offset(i, 1).Value = IE.Document.Title url.Offset(i, 3).Value = url.Offset(i, 2).Value '前回日付 url.Offset(i, 2).Value = IE.Document.LastModified i = i + 1 Loop End Sub

whoops101
質問者

お礼

ありがとうございました!!!!! 無事解決しました。 とてもスムーズに出来ました。 どうもありがとうございましたっ。

関連するQ&A

  • PHPでHTMLソースから特定のURLを抽出したい

    PHPで外部サイトのHTMLソース内の特定のURLを取得するにはどうすればいいでしょうか? 具体的には楽天市場の個別商品ページのHTMLソースにあるレビューページのURLを抽出したいと思っています。 ttp://item.rakuten.co.jp/asagao/332/のHTMLソースから レビューページのURLのttp://review.rakuten.co.jp/item/1/229861_10000050/1.1/を取得するようなプログラムを作りたいと思っています。 自力で頑張ってみたもののPHP初心者のため、preg_matchや正規表現でお手上げ状態になってしましました。 プログラムのソースコードを教えていただけると助かります。 ご回答よろしくお願いします。

    • ベストアンサー
    • PHP
  • WordPressで作られたサイトの情報の抽出方法

    とある会社でデザイナーをしている者ですが、会社のHPをリニューアルすることになりました。 会社のHPは、WordPressで作られていますが、諸事情により中の情報を全て抽出しなければならなくなり、その方法を教えていただけたらと思っています。 私はコーディングの知識もなければ、サーバーやPHPの知識もなく…。WordPressも全くもっての初心者です。CSSやHTMLの知識も習得せねばと考えていますが、初心者でも分かるような抽出方法ありますでしょうか? ちなみに使用しているPCはMacBook Airです。 宜しくお願い致します。

  • 自動巡回+一部のテキストを抽出するソフト探しています

    ホームページのデータを収集してEXCELで表にしたいのですが、 ホームページのURLおよびHTMLソースは一定しているものの、 収集したいデータは数百ページもあり、いちいちソースを開いて、 探して抽出するのは非常に非効率で、途方にくれています。 一定の連番の持つURL(予め用意したURLリスト)を自動巡回して、 HTML内の一部のテキスト(行指定して1行~数行)を抽出するソフト探しています。 もちろんHTMLソースが一定の法則になっています。 (htmlタグは変わらないが、テキストとURLだけは違う・・・) 例えば、  http://www.***.com/data/1255.html  http://www.***.com/data/1256.html  http://www.***.com/data/1428.html のようにURLは一定していること。 個別のHTMLソースでは例えば、 18行目の・・・ 『 <td width="100"><b><font size="-1">●●●●</font></b></td>』  の●●●●だけを抽出するとか・・・  これをCSVやウェブでテキストベースで表示できれば幸いです。 そのようなソフトはございますか? よろしくお願いします。

  • PHPでMDBファイルからの抽出、表示をしたい

    このたび初めてPHPを使おうと思い色々勉強しているのですが 今までCGIばかりだったので今ひとつピンとこなくて困っています やりたいことは サーバー上にMDBファイルを置いて(このファイルはMSアクセスで 作成した物です) それを閲覧させたいのです。 ファイルの内容は簡単にいうと 商品名 産地 価格 納期 備考 と言うような内容で 何千とレコードがある物です。 まず最初に条件を選択するページを表示 次に条件を含んだ情報を一覧表示 次にその一覧から詳細情報がほしい場合、クリックして詳細情報を表示する と言うような内容で、ブラウザーでデーターベースの書き換えと言うことは 何もしないです。 今まではデーターをCSVに変換してアップと言うような 状態でしたが、PHPというのを使えば簡単にしかも軽く 同じ事が出来ると言うことを聞き挑戦しています。 いくつかのページで、DBへの接続と言ったことは かかれていて 何となくつかめてきたのですが 抽出、表示 と言ったプロセスが全くと言っていいほど分かりません あと 根本的なことですが 仮にPHPができあがったとしてMDBファイルは サーバー上にそのままポンとおいておけば良いのでしょうか? どなたか こう言ったことが勉強になるページや 他力本願ですが、これに近いサンプルがあるようなページ をご存じでしたら教えてください よろしくお願いします。  

    • ベストアンサー
    • PHP
  • 外部PHPファイルの読込みについて

    いつもお世話になります。 外部PHPファイルの読込みが、期待通りの動作をしません。 レンタルサーバ会社は、Aサーバ、Bサーバ 同じ。(条件同じ) allow_url_fopen は、defaultの ONです。 まずAサーバに、agent.phpをアップロード。agent.phpファイルの中身は、 <?php $agent =$agent = $_SERVER['HTTP_USER_AGENT']; ?> これを、Bサーバの、test.phpに読込み。test.phpの中身は、 <?php include("http://BサーバのURL/agent.php"); echo "<html><head><title>.....</title></head>\n"; echo "<body><p>UserAgent : " . $agent . "</p></body></html>\n"; ?> この場合、http://BサーバのURL/agent.phpを開いても、 UserAgent($agent)の値は出てきません。これは、どうしてでしょうか? 但し、Aサーバに、下記のPHPファイル(xyz.php)をアップロードして <?php echo "<p>あいうえお</p>\n"; ?> として、Bサーバのtest.phpの中身を <?php echo "<html><head><title>.....</title></head><body>\n"; include("http://BサーバのURL/xyz.php"); echo "</body></html>\n"; ?> として、test.phpを読み出すと、「あいうえお」と出力されます。 何故なのか、またどうしたら期待通り動作するのかを、教えて下さい。  よろしくお願いします。

    • ベストアンサー
    • PHP
  • PHPのタイトルの取得

    こちら(http://wsd.zombie.jp/gw/php_curl_file_get_contents/)のページとこちら(https://www.php.net/manual/ja/funct ion.file-get-contents.php)のページを参考に別ページからタイトルを取得したいと思っているのですが、できませんでした。(上記のサイト様では、ヤフーニュースの取得ができるらしいのですが、表示されませんでした。) webページのタイトルを取得したいです。 index.phpファイル <a href>="ここに下記タイトルを取得"</a> ーサーバー上の別ページー page1.php <title>練習</title> このようにしたいので教えてください。

    • ベストアンサー
    • PHP
  • PHPファイルの表示

    PHPに関する知識がまったくないのでご指導ください。 PHP形式で作ったホームページデータをサーバーからダウンロードし、 ドメインを変更したため別のサーバーにアップしたのですが、 きちんと表示されません。 旧アドレスでは、   ○○○.com  ○○○.com/index.php どちらでも表示するのに、 新アドレスでは、   △△△.com  △△△.com/index.php どちらでもダメです。 試しに普通のHTMLファイルを送ってみたところキチンと表示されますので、 サーバーエラーではないようです。 PHP形式のホームページデータを表示するようにするには、 何かサーバーにアクセスする必要があるのでしょうか。

  • 重複ファイルの検索と抽出

    はじめまして サーバーの整理をしています。 重複ファイルを検索し、抽出できるフリーソフトをご存知でしたら教えてください。 ファイル名とパス名を抽出したいです。 よろしくお願い致します。

  • phpファイルが勝手にダウンロードされる

    仕事でホームページのリニューアル作業をしており、リニューアルに伴いサーバーも別のものに移動することになりました。その際に今までに使用していたメールフォームのphpファイルや.htaccessを新サーバーにアップしたのですが、そうするとメールフォームのあるページに移動すると、phpファイルが勝手にダウンロードされてしまいました。それどころか今までの正常に作動していた新サーバーにあるphpファイルも勝手にダウンロードされるようになってしまいました。 php 勝手 ダウンロードなどのキーワードで調べ、同じような内容の質問もあったのですが、 プログラムやWEBサーバー系のことはさっぱりわからなくてどうしていいのか途方にくれている状態です。 今まで使用していたメールフォームがxsrvという特殊なサーバーにあるということはわかっているのですが、どうすればいいのでしょうか。やはりサーバーやプログラム関係が触れないと修正は難しいのでしょうか。 原因の見つけ方等をご存知の方がおられましたら宜しくお願いいたします。 ※参考にしたサイト http://www.xserver.ne.jp/ http://okwave.jp/qa/q3518318.html

  • PHPファイルにおける閲覧者が受けるデータ量

    PHPでHTMLを生成して表示させるとします。 例えばですが、PHPファイル自体が100KBあったとしても、閲覧者がダウンロードするデータ量は生成されたHTML分だけという認識だったんですがあってるでしょうか? 生成されたHTMLを普通にHTMLファイルとして手書きしても1KBぐらいにしかならないものとします。 元のPHPファイルが何GBとかあったとしても、閲覧者が受け取るデータ量は1KBですよね? 僕は小分けにすると分からなくなるので一つのPHPファイルにまとめて書いてるんですが、PHPファイル自体のデータ量を見て自分の認識に不安を感じ始めました。 PHPはサーバー側で処理する言語ですから、閲覧者に一度PHPファイルを全て渡して処理を始めるなんてことはないですよね? 大きなPHPファイルになったとしても処理が重くなるだけで、閲覧者が受け取る時のデータ量が大きくなることはないですよね? スマホ向けサイトを作っているもので、もしこの辺の認識が間違ってると、閲覧者にとんでもないパケット料を支払わせてしまいそうで恐いです。 あくまで生成されたHTML分のパケット代しかかかりませんよね?

    • ベストアンサー
    • PHP

専門家に質問してみよう