締切済み

ルビを含むHTMLファイルの検索方法

2012/04/28 10:38

iPhoneやAndroid向けのネイティブアプリを作っています。 HTMLファイルをwebviewで読み込む電子書籍アプリです。そのテキストにはふりがなのためのrubyタグやrp、rtタグが入っているのですが、（さらに言うと、途中にアンカー（aタグ）も含んでいます。）その文字列の検索方法で悩んでいます。試しに通常のPCのブラウザ（chromeやfirefox）で「CTRL+F」で検索を行ったところ、ブラウザ上でも検索ができないということがわかりました。文字を検索すると、おそらく間に挟まれているタグが引っかかるためでしょうが、正しく検索できません。例えば、「私（わたし）は学（がく）生（せい）です」というようなふりがなの付け方だと、「私」や「学」であればヒットするのですが、「私は」や「学生」が検索できないのです。電子書籍アプリですので、検索ができると便利です。ふりがながつかないテキストであれば、プログラム側でHTMLファイルをバッファに読み込んで、そこから文字列探索を行えば検索できるのですがルビがあるファイルなので困っています。結果としては、存在した行を抜き出す（改行brから改行brまで、あるいはpからpの終了タグまで）といったことをしたいと思っています。どのような方法が考えられるでしょうか。使用言語はIphoneではObjective-C、AndroidではJavaを用いています。将来的にはWindowsなどのPCでも似たようなアプリを作りたいとも考えています。どうぞよろしくお願いします。

Rupyjp
お礼率95% (19/20)

その他（プログラミング・開発）
回答数2
ありがとう数2

みんなの回答 （2）
専門家の回答

みんなの回答

dscripty
ベストアンサー率51% (166/325)

2012/05/02 06:46 回答No.2

なるべく簡単そうな実装を考えてみたよ！検索対象の文書をルビの切れ目で区切ったディレクトリに見立てる。ディレクトリには漢字とルビのディレクトリがあって、各ディレクトリのリンク先は共通の次の文字列のディレクトリ。次のディレクトリは、単一かもしれないし、ルビで二つかもしれない。あとは、ディレクトリの探索と同じ。

dscripty
ベストアンサー率51% (166/325)

2012/04/29 11:36 回答No.1

急いでないなら、Firefox のバグ登録をしちゃおう！そのうち直るから、ソースを参考にするといいよ？いそいでるなら、正規表現を自分で拡張するしかないかなぁ。。。 google.com でキーワードを英語にして検索かけてみた？他の人が既に解決してるかも。

質問者

お礼 2012/05/02 00:11

なるほど。Firefoxの開発者は出来る人ばかりでしょうからあっという間に直してくれるかもしれないですね。出来れば自分で対応したいですが、正規表現を拡張するのはかなり厄介でしょうね。検索ではいい方法は見つからなかったですね。どうもありがとうございます。

ルビを含むHTMLファイルの検索方法

みんなの回答

お礼 2012/05/02 00:11

関連するQ&A

web上のHTMLタグ入りのtextファイルを表示させてい

HTMLファイル内の実際の改行（<BR>ではなく）を一括消去する方法

HTMLファイルが表示されない

HTML→テキスト変換ツール

HTMLソースファイルからタグを取り除く方法

WebページHTMLをテキストファイルとして取得する方法

HTMLファイルにテキストファイルをインクルードする方法。

テキストファイルのHTMLタグを文字として表示させるには？

HTMLタグのエスケープ文字をタグに戻す方法

ＨＰをＨＴＭＬタグで作成してるのですが、ブラウザで見ると微妙に文字が

同じＣＳＳファイルにつなげている、4つのＨＴＭＬファイルの1つが、fi

ApacheにてHTML・PHPファイルが文字化けします

HTMLタグを説明するページをつくるには

ＨＴＭＬで作成⇒一旦保存⇒ファイルを開くと…

マックOS Xのテキストエディタ、JeditXでのパターン検索

HTMLで長文の表示方法

ＨＴＭＬのテクスト折り返しをＩＥでさせる方法を教えてください_読点_ｇ

Smartyで出力したHTMLコードが改行されない

DBとHTMLファイルを検索したい

自作検索ページを作りたい

注目のQ&A

カテゴリ
一覧

専門家に質問してみよう
専門家登録

あなたにピッタリな商品が見つかる！ OKWAVE セレクト

ルビを含むHTMLファイルの検索方法

みんなの回答

お礼 2012/05/02 00:11

関連するQ&A

web上のHTMLタグ入りのtextファイルを表示させてい

HTMLファイル内の実際の改行（<BR>ではなく）を一括消去する方法

HTMLファイルが表示されない

HTML→テキスト変換ツール

HTMLソースファイルからタグを取り除く方法

WebページHTMLをテキストファイルとして取得する方法

HTMLファイルにテキストファイルをインクルードする方法。

テキストファイルのHTMLタグを文字として表示させるには？

HTMLタグのエスケープ文字をタグに戻す方法

ＨＰをＨＴＭＬタグで作成してるのですが、ブラウザで見ると微妙に文字が

同じＣＳＳファイルにつなげている、4つのＨＴＭＬファイルの1つが、fi

ApacheにてHTML・PHPファイルが文字化けします

HTMLタグを説明するページをつくるには

ＨＴＭＬで作成⇒一旦保存⇒ファイルを開くと…

マックOS Xのテキストエディタ、JeditXでのパターン検索

HTMLで長文の表示方法

ＨＴＭＬのテクスト折り返しをＩＥでさせる方法を教えてください_読点_ｇ

Smartyで出力したHTMLコードが改行されない

DBとHTMLファイルを検索したい

自作検索ページを作りたい

注目のQ&A

カテゴリ 一覧

専門家に質問してみよう 専門家登録

あなたにピッタリな商品が見つかる！ OKWAVE セレクト

　ＨＰをＨＴＭＬタグで作成してるのですが、ブラウザで見ると微妙に文字が

カテゴリ
一覧

専門家に質問してみよう
専門家登録