• ベストアンサー

TurboLinuxにて、スペースアルクのhtmlソースを取得するjavaプログラム

現在、javaプログラムで スペースアルクというオンライン辞書のホームページの htmlソースを取得するプログラムを作っています。 yahoo japanの時はうまくいったのですが、 このHPの場合、 <font color='#FF9999'>★</font><b>推奨ブラウザについて</b><font color='#FF9999'>★</font><br> 英辞郎をご利用いただく際には、以下の環境をおすすめします。<br> <br> ・Internet Explorer 5.0以上<br> ・Netscape 6.0以上<br> <br> 申し訳ありませんが、上記より低いバージョンのブラウザソフトでは、レイアウトや表示・機能が正常に行われません。<br> なお、以下のサイトから最新のブラウザをダウンロードすることができます。<br> <br> <a href="http://www.microsoft.com/japan/ie/" target="_blank">Microsoft Internet Explorer 最新版ダウンロード</a><br> <a href="http://wp.netscape.com/ja/download/" target="_blank">Netscape ダウンロード</a></td> というソースが返ってきます。(当然、元のページのソースにはこういうことは書いてないです)      どうすればうまくソースを取得してこれるのか教えてください!

  • Java
  • 回答数2
  • ありがとう数0

質問者が選んだベストアンサー

  • ベストアンサー
  • utakataXEX
  • ベストアンサー率69% (711/1018)
回答No.2

URLConnection.setRequestProperty("User-Agent", "偽装AGENT"); を使用してHTTP_AGENTを偽装すれば行けそうな気がします。 接続先のURLへ情報を送信し、結果を保存する http://www.atmarkit.co.jp/fjava/javatips/069java006.html

参考URL:
http://www.atmarkit.co.jp/fjava/javatips/069java006.html

その他の回答 (1)

  • ngsvx
  • ベストアンサー率49% (157/315)
回答No.1

適切なユーザーエージェントを送ればいいと思います。

関連するQ&A

  • <FONT>のCOLOR属性について

    <FONT> の COLOR 属性の色指定と <BODY BGCOLOR> の色は色差(312)が不十分です。と診断されます。 <FONT size="-1" color="#ff0000"><FONT size="-1" color="#ff0000"><B>TOP</B></FONT><BR> また、<FONT> の COLOR 属性の色指定と <BODY BGCOLOR> の色は明度差(38.989)と色差(147)が不十分です。 とも診断されます。 </FONT><FONT color="#ffffcc" size="-1">--------------------<BR> </FONT><B><FONT color="#ffffcc" size="-1">PR</FONT></B><FONT color="#000000" size="-1"><BR> <BR> <A target="_blank" href="http://○○.com/">あいうえお<BR> かきくけこ</A><BR> </FONT><FONT color="#ffffcc" size="-1">--------------------<BR> どうしたら、いいですか?知識不足野郎です。すいません、誰か、教えてください。

    • ベストアンサー
    • HTML
  • p target とは

    <p target="_blank"><font color="#ff00ff" size="4"><a href="リンク先"></a> <img alt="表示" src="faile address.gif" /> </font></p> の意味を教えていただけませんでしょうか。 いろいろなサイトのソースを見て勉強させていただいてるんですが、後ろのアドレスにターゲットブランクを入れると別窓表示というのは知っていました。でもあるサイトで上記のようなタグが入っており、 ブラウザで見るとfaile address.gifの画像がでてるだけで クリックしてもリンク先が表示されないし このタグのすぐ下にテキストリンクでリンク先が <a href="リンク先">リンク先</a>のように のっています。 これはどういう意図のタグになるんでしょうか。 <p target="_blank">で検索してみても 出てきませんでした。 詳しい方、よろしくお願いします。

    • ベストアンサー
    • HTML
  • モバイルサイトを作ってますけど、たまにdreamweaverでソースが

    モバイルサイトを作ってますけど、たまにdreamweaverでソースが黒くなるときがあります。 ーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーー <div> <font color="FF7400" size="-1" style="font-size:xx-small" color="#5C410D"> ■ <a href="#">test</a><br /> ■ <a href="#">test</a><br /> ■ <a href="#">test</a> </font> </div> ーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーー <font color="FF7400" size="-1" style="font-size:xx-small" color="#5C410D"> </font> この部分がそうなるのですが、これってdreaweaverの問題ですか? 実際にサイトで確認してみると問題はありませんが、、、

  • マクロの事で質問です?

    以前、「マクロを使ってこんな事って出来ますか?」を質問した者です。 http://oshiete1.goo.ne.jp/qa4035950.html ANo.4のKenKen_SPさんの回答が参考になりました。 そこで、KenKen_SPさんのソースを参考にして別の事をやってみたのですが、うまくいきません。 やりたい事は エクセルのA列に文章 B列にURLを入力してマクロを使って下記のようにメモ帳に出力したいです。 例 1ここに文章...<a href="http://123.com" target="_blank">続きはこちら</a><br> 2ここに文章...<a href="http://234.com" target="_blank">続きはこちら</a><br> 3ここに文章...<a href="http://345.com" target="_blank">続きはこちら</a><br> 4ここに文章...<a href="http://456.com" target="_blank">続きはこちら</a><br> いつも聞いてばかりですいませんがよろしくお願いします。

  • 勝手にタグが改変されてしまいます。

    初心者レベルでお許しください。 ブログにタグを貼ろうとしていますが、 <a href="~><img src="~></a><br><br><a href="~><img src="~></a><img src="~/gif.gif"> という構文をソースで入力し、 普通のモードに変えると、何故か勝手に改変されタグも変わってしまいます。 (~の部分はIDやホームページなどがかかれています。) <a target="_blank" href="http~></a><br /> <br /> <a target="_blank" href~></a><img alt="" src="http~> これが勝手に改変されないようにするにはどうしたらよろしいのでしょうか? 宜しくお願いいたします。

  • マクロの事で質問?

    昨日、マクロの事で質問した者です。 http://oshiete1.goo.ne.jp/qa4105086.html そこで下記のソースを教えてもらいました。 Sub testo()      If Not TypeOf Selection Is Range Then Exit Sub      Dim i   As Long   Dim sPrev As String     Open "C:\test.tmp" For Output As #1      ' // Output html   sPrev = "" For Row = 1 To 4 Print #1, Cells(Row, 1) & "...<a href=""" & Cells(Row, 2) & """target=""_blank"">続きはこちら</a><br>" Next   Close #1   Shell "notepad.exe C:\test.tmp", vbNormalFocus      End Sub 質問ですが、この場合 For Row = 1 To 4 が入っていて4行目までしか表示されません。 そこでFor Row = 1 To 100 とかした場合、100行目までデータがあればいいのですが、ない場合は 説明文1...<a href="http://123.com"target="_blank">続きはこちら</a><br> 説明文2...<a href="http://123.com"target="_blank">続きはこちら</a><br> ...<a href=""target="_blank">続きはこちら</a><br> ...<a href=""target="_blank">続きはこちら</a><br> ...<a href=""target="_blank">続きはこちら</a><br> このようになってしまいます。 データがない時は表示されないようにするにはどうすればいいのでしょうか?

  • 新しいブラウザの大きさ指定。

    新しいブラウザを開いたときに、そのブラウザの大きさを指定することはできますか? 大きさを決めてしまうと、見てる人にとっては嫌がられるかもしれませんが、今回はファイルをアップロードするためにメインのページから、新しくウィンドウを開いて、アップロードできるようにしたいのです。 今は新しくウィンドウが開きますが、元のウィンドウの大きさと同じ大きさで開きます。 文字数があまりないのと、メインページの上において両方見えるような感じにしたいのですが。 [メインのページのソース一部] ・・・・・ <br> <font size=4><A HREF="gazou_upload.html"TARGET=_blank>テクスチャアップロードはこちらから。</A></font> <br> ・・・・・ [アップロード] <html> <head> <title>ファイルのアップロード</title> </head> <br> <font size=4 font color=blue>ここではWeb3Dに反映させたいテクスチャをサーバにアップできます。</font><br> 参照から選択しアップロードしてください。<br> <font color=red>----------文章---------<br> ----------文章---------</font><br> <br> <body> <form method="POST" action="gazou_upload.php" enctype="multipart/form-data"> <input type="hidden" name="max_file_size" value="1000000" > <input type="file" name="userfile"><br><br> <input type="submit" value="アップロード"> </body> </html> どこにどういった記述をすればいいか教えていただけませんか? よろしくお願いします。

  • 表示できないページ

    社内のイントラを作成しています。 以下のソースのページを作成したのですが、 WIN95、IE5.00の端末で開くと「ページが表示できない」 というメッセージがでて、ページが表示できません。 原因として、なにがおかしいのでしょうか? 宜しくお願いします。 << ソース >> <HTML> <HEAD> <META http-equiv="Content-Type" content="text/html; charset=Shift_JIS"> <META http-equiv="Content-Style-Type" content="text/css"> <TITLE></TITLE> </HEAD> <BODY BACKGROUND COLOR="white" TEXT="#FF80C0" LINK="#FF80C0" VLINK="#009999"> <CENTER> <P STYLE="BACKGROUND-COLOR:00D9B2;"><FONT SIZE=3 COLOR=#CC0099>便利なリンク集</FONT></P> <BR> <FONT SIZE="4" COLOR=BLACK><B>~便利なリンク集~</B><FONT> <P><BR> </CENTER> <IMG SRC=""CLASS="PARAM1" ALIGN="right" width="100" height="90"> <BR><BR><BR> <CENTER> <TABLE BORDER="0"WIDTH="350">  <TR VALIGN="MIDDLE" ><FONT SIZE=3 COLOR=#000000><A HREF="html"> 情報・通信グループ  ユーザ管理システム (ユーザ向け)</A></FONT></TR>  <TR VALIGN="MIDDLE" ><FONT SIZE=3 COLOR=#000000><A HREF="soum2.html" >事故報告書の作成(SEが対応した事故を対象とする)</A></FONT></TR> <TR VALIGN="MIDDLE" ><FONT SIZE=3 COLOR=#000000><A HREF="doc"> 東京インフラG  所有品の持出しについて </A></FONT></TR><BR> <TR VALIGN="MIDDLE" ><FONT SIZE=3 COLOR=#000000><A HREF="">PG制定要否決裁流れについて</A></FONT></TR> </TABLE> <BR><BR> <FONT SIZE="4" COLOR="RED"><A href=""><B>back</B></A></FONT> </CENTER> </BODY> </HTML>

    • ベストアンサー
    • HTML
  • HTMLについて教えて下さい。

    上のブルーのラインを削除したいのですが、どこを削除すれば良いか教えて下さい。 <center><table width=640 bgcolor=#ffffff cellspacing=1 cellpadding=5><tr><td bgcolor=#ACE6FF colspan=2 align=center><b></td></tr><tr><td bgcolor=#ffffff colspan=2 align=center><font size=2 color=#777777></font></td></tr></table><br><a href="http://myauc.jp/user/gakuensalon?t=%83o%83X%83%7D%83b%83g" target=_blank><img src=http://image.auctions.yahoo.co.jp/banner.gif border=0><br><font size=2><BR>この他にも出品しておりますので宜しければご覧ください。</font></a><br><br></center>

  • バナーが見えない(mac Internet Explorer5.2)

    バナーを貼ったのですが、サーバーにアップする前の確認では見えるのですが、サーバーにアップすると何も出てきません。(Internet Explorer5.2 mac版です) windowsのInternet Explorerでは見えますし、Netscape(mac)でも見えるしリンク先にもちゃんととぶのですが…なぜなのでしょうか。 ソースとしては、 レイヤーを作り、その中に <a href="http://www.*****.com" target="_blank"> <img src="http://*****.com/333/banners/44444.gif" alt="Banner" width="88" height="31" hspace="5" vspace="5"></a> という風になっています。 何故なのか、そしてmacのInternet Explorerで見れるようにする方法があるのか、よろしければ教えて下さい。お願いします。

専門家に質問してみよう