• ベストアンサー

mhtファイルからの日本語部分の抽出

wordでmhtファイルとして保存した場合、 保存したファイルをエディタで見ると、 日本語の部分が ㍃ 等になっています。 これらは、文字コードなのでしょうか? 実際には、 これらの部分から、指定した単語を検索して、 置換する、というようなことを実現したいと考えています。 そのため、㍃ 等の部分から日本語の文字列を取得するにはどのようにすればよいのでしょうか?

  • gwky
  • お礼率45% (5/11)

質問者が選んだベストアンサー

  • ベストアンサー
回答No.1

xmlで &#○○; と指定すると Unicodeの文字になると思います。 実際に抽出するものが Excel VBA,Word VBAなのかVB.NETなのかVB6なのか,VBScriptなのか わからないのでここまでの回答のみです。

gwky
質問者

お礼

なるほどー、Unicode になっていたんですね。 大変助かりました。スピーディなご回答、 どうもありがとうございました!!!

関連するQ&A

  • ソースコードの中から、日本語が使われている行・韓国語が使われている行を抽出したい

    あるアプリケーションのソースコード(言語はC#)があります。 このアプリケーションは元々、日本国内で使うものであるため、文字列(ダブルクォーテーションで囲まれているところ)には日本語(漢字、ひらがな、片仮名など)が使われています。 このアプリケーションの韓国語バージョンのソースコードもあります。基本的に、元の日本語バージョンの文字列の中の日本語を韓国語におきかえたものと思われます。(画面コントロールの位置や形などが違ったり、その他微妙な違いはありますが。) 元の日本語バージョンのソースコードから日本語の使われている文字列の行、韓国語バージョンのソースコードから韓国語が使われている文字列の行を探したいと思います。 ダブルクォーテーションが存在する行は秀丸エディタでgrepで探せますが、当然、日本語バージョンであっても文字列には、日本語が含まれていないもの(アルファベットだけとか)があります。 日本語が使われている行だけをgrep(抽出する・探す)したいのですが、どうすればよいですか。 できれば、秀丸を使いたいのですが、他のエディタなどでもかまいません。 それから、逆に、韓国語に置き換えたソースコードから、韓国語(ハングル)が使われている文字列の行だけを抜き出すにはどうすればよいでしょうか。 文字コードは、日本語バージョンも韓国語バージョンもANSIです。 コメント行は要らないので対象外ですが、そのことは考えなくていいです。(もし抽出されてしまっても、対処します。)

  • ~.mhtファイルが、なにやら、文字化けして(>_<)

    WINDOWS98SE、IE5.5SP2です。 突然、~.mhtファイルが文字化けして、(開くと、なにやら呪文のような・・文字化けした文字が、上から下まで、ずらずら~っと!!)正常に見ることができません!! IEもなんか変で、ファイルの保存で、 ~.mhtファイルで保存する~を選んでも、 webページの保存エラーの、ちっちゃなウインドウ (赤い×印のある)が開いて、保存することが できません。 どうしたら、もとのように正常になるでしょうか!(>_<) 因みに、システムツールの、[IEの修復~]を使っても、直りませんでした!大変困っています! よろしくお願い致しますm(__)m

  • .mhtで保存したHPの単語に線を引いたりできないか?

    .mhtで保存したHPの単語に線を引いたりできないか? IE8を使用中です。 英語の勉強のためによくHPを.mht形式で保存するのですが、.mhtで保存したHPの単語にofficeのwordのように色を塗ったりすることはできないでしょうか? またはそのような加工ができるソフトをご存知でしたら教えてください。 よろしくお願いします。

  • mht をEdgeで開きたい。

    Explorerで、「Web アーカイブ、単一のファイル」で保存したものが、開けなくなりました。つい最近まで開くことができたのに。 多分、マイクロソフトがEDGEに移行させるために、Explorerではmht を開けないようにしたのだと思います。 Edgeなら開けるかもしれないのですか(やってみないとわからないけど)、やり方がわかりません。EDGEにはファイルボタンがありません。 mht を右クリック・プログラムから開くにしても、Explorerしか出てきません。 どうすればいいですか。 また、Edgeでファイルを開いたり保存したりは可能ですか? Explorerでmht を開く方法をご存知の方は、下記に答えていただきませんか。 http://okwave.jp/qa/q9248883.html

  • ファイル内の文字列を置換

    掲示板利用させていただきます。 現在、ファイル内の特定の文字列を置換し、 保存する方法を探しています。 できればスクリプト言語を利用したいと考えています。 sedコマンドを使用して文字列置換を行ったのですが 置換前と置換後のファイルで 文字コードと改行コードが変わってしまうのでダメでした; 「ファイル内の特定の文字列を任意の文字列に置換し、置換前と置換後で改行コードと文字コードを変えない方法」 をご存知の方、ご教示ください。 bash,perl,javaのどれでも結構です。 よろしくおねがいします。

  • 複数のワードファイルの一括置換について

    フォルダ内にあるワードファイルにある文字列を一括置換したいと考えております。 ワードファイルは10個以上はあり、まったく同じ言葉が含まれております。 使用環境はWindowsXP、Word2003を使用しております。 シェアウェアのソフトは見つけたのですが、フリーソフトは見つけることができませんでした。 置換したい文字列は、ごく一般的な日本語です。 詳しい方どなたかよろしくお願いいたします。

  • ファイルの日本語コードの調べ方

    2つの同じようなファイルがあり、あるアプリからファイルをインポートしますが、1つはOKですが、1つはNGです。エラーの発生は//の間の日本語の部分で、2つめの/がどうも認識されていないようです。日本語部分は完全に文字化けしていました。 おそらくUTF-8のユニコードであれば正しく認識されると思うのですが、2つのファイルは見た目は日本語部分は同じですが、日本語のコードが現在何か調べる方法はありますか。

  • 保存したmhtファイルの編集

    私はよく気に入ったWEBページを「WEBアーカイブ・単一のファイル」で保存するのですが、この保存したファイルを編集することはできるのでしょうか? 保存したmhtファイルを右クリしてワード編集してみましたが出来上がったファイルはおかしな表示になってしまいます。 オリジナルの姿で編集・保存することは可能ですか? ちなみに使用しているブラウザはIE9です。 以上、よろしくお願いします。

  • バイナリファイル中の日本語文字列の取り出し

    C++にて,バイナリファイル中から日本語の文字列を取り出す処理に苦心しています. 具体的にはPDFファイルのXMPの記述部のXMLに日本語が含まれる場合なのですが,日本語(この場合はUTF-8ですね)の部分が含まれる部分をfread()で読み出してchar[]型の配列に入れて,printfで表示する(漢字コードの変換処理はとりあえずnkf等でUTF-8→SJISに変換)と文字化けします. Javaで同じような処理をしたときは,String の変数にUTF-8で日本語の文字列が挿入され,その文字列を扱うことができたのですが,C++での扱いがわかりません. ご教授よろしくおねがいします.

  • 日本語ファイル名のアップロードとダウンロード

    日本語ファイル名のデータを、ブラウザ上のフォームを使ってWEBサーバにアップし、それらをブラウザに一覧表示させてリンクを張り、そのリンクをクリックするとダウンロードできるようなPHPスクリプトを作りたいと思っています。 URLエンコードを行い、日本語ファイル名を半角文字列に置き換えれば問題ないだろうと思ったのですが、URLエンコードされたサーバ上のファイルにさえアクセスできません。 サーバの文字コードがEUCなので、すべてEUCで作成しているのですが…。 例えば、「あ.txt」というファイルを、EUCで作成したフォームでURLエンコードをしてアップロードすると、「%A4%A4.txt」というファイルがサーバにアップされます。 そこで、「http://。。。/%A4%A4.txt」にブラウザでアクセスすると、403エラーが出ます。 次に、ブラウザに一覧表示させたリンク文字列を右クリックして保存しようとすると、「?¢.txt」というファイルを保存しようとするため、ファイルが見つからないとのエラーが出ます。 いろいろな文字コードでファイル名をエンコードしたり、PHPファイルの文字コードを変更したりして試してみたのですが、うまくいきませんでした。 どうすればいいのか教えていただけないでしょうか? なお、日本語は使わない方がいいということは承知しておりますが、数十個ある日本語ファイル名のデータを頻繁に更新しますので、その都度ファイル名を半角に書き換えることは避けたいと思っています。 元々のファイル名も、仕様により日本語である必要があります。 以下、当方の環境を記載いたします。 「ローカル」 WinXPsp2、IE6 「サーバ」 共有レンタルサーバ Apache

    • 締切済み
    • PHP

専門家に質問してみよう