正規表現で漢字3文字「大◯◯」を検索したい

このQ&Aのポイント
  • 正規表現を使用して漢字3文字「大◯◯」を検索する方法について教えてください。
  • 質問1) 漢字の場合、どのように検索すればよいですか?
  • 質問2) 「大」の後が2文字熟語で検索したい場合、どのようにすればよいですか?
回答を見る
  • ベストアンサー

正規表現で漢字3文字「大◯◯」を検索したい。

小説を保存したテキストファイルにある、漢字3文字熟語「大◯◯」を「Word2010」で一度に検索したいです。   例)大火事、大渋滞 など 正規表現を使用すれば可能でしょうか。 「大」あとに、ひらがなやカタカナが1文字くるなら (大)([あ-ん,ア-ン]) でいいと思うのですが、 質問1) 漢字の場合どうなりますか。検索した限りでは    (大)([亜-腕弌-熙])    (大)([一-龠])     で、「大」の後1文字以上漢字がある場合は検索できそうですが、これ以上はわかりませんでした。 質問2) 「大」の後が、2文字熟語<限定>で検索したい場合はどうなるのか。 質問3) 漢字3-4文字の例はあんまりないかもしれませんが、応用が効きそうなので、、、「大」の後、漢字1文字しかないものは含まないー漢字2文字<以上>の場合ーはどうなるのか。 質問4) 漢字の範囲を表す表現は上記のように複数見つかりましたが、一番いい方法というのはあるのでしょうか。使い分けとか有りますか。 を知りたいです。 以上をご存じの方、教えて下さい。 また、フリーソフトなど正規表現以外の方法があれば、それもアドバイスいただければ助かります。 何卒よろしくお願い致します。

質問者が選んだベストアンサー

  • ベストアンサー
回答No.1

Wordですと「ワイルドカード」検索です。 大○○:大[一-龠]{2} 大○○○+大○○○○:大[一-龠]{3,4} ”大”のあと1文字以上:大[一-龠]{1,} Wordのシステムが、単純な漢字の並びとして検索するのか、単語を検索するのか、そのへんはわかりません。 ですので、思いどおりの結果がでるかどうかはあまり期待しないほうがよいかと・・・。

KIMUSAKA
質問者

お礼

色々と参考になります。 試行錯誤しつつ活用したいと思います。 回答ありがとうございました。

関連するQ&A

  • 正規表現について

    正規表現につての質問です。 今テキストファイルに下記のような漢字と数字が並んでいます。 そこから、漢字一文字だけの行を抜き出してきたいのですが、うまくいきません。PerlとCygwinを使用しています。よろしくお願いします。 人584504122 情報542701982 商品510342870 日414551872 方347990908 者347069359 中339925319 表示330177395 的324961911 私323727263 検索291502623 見ル285226619 場合275698771 一256241900 利用253752129 年240881734 時239273060 前228762989 店225241510 登録224560617   ・   ・    ・ プログラム中身 #! /usr/bin/perl -w #テキストから指定した単語などとマッチすると、 #その単語を含んだ文を抜き出してくる。 while(<>){ s/ +//g; s/\s+//g; if(/^([亜-煕]|[一-龠]){1}[0-9]*/){ print; print "\n"; } }

  • 正規表現での文字列検索

    WIN7で使用しているアプリケーションで文字列検索する場合の 正規表現について教えてください。 問) 下記の例文で「A」を含む文字列を検索する場合に、「▼」が含まれる場合は 最後の「▼」の後に「A」がある場合のみ検索したい。 例文の場合、(2)、(3)のみヒットさせたい。 例文) (1)***A**▼**▼*** (2)****▼*A** (3)**A**** (4)***▼**A▼**** *、▼の数はいろいろで*は任意の文字です。 よろしくお願いします。

  • 正規表現についてです

    正規表現についてです 「婚活」や「生活」の様に「〇活」という例を「少納言」を利用して集めたいのですが、その際 検索方法の前文脈や後文脈は正規表現で表す場合はどうすれば良いのでしょうか? 回答例としては↓ 検索→空白 前文脈→○○ 後文脈→○○ の様に答えて頂けると有難いです 更に解説があると今後助かるので良ければお願いします

  • 正規表現の使い方をお教えください

    サクラエディター使っていますが・・・。  例・正規表現である文字が行の二か所以上あるとき最初に出てくる文字より・ この場合「文字」が二か所ありますが先に出てきた「文字」より前を削除したいのですが 後の方の「文字」より前側削除なってしまいますがどのようにすればよいのかお教えください。   宜しくお願いします。

  • |。ってなんですか? 正規表現

    正規表現の学習中です。読んでいる本の中に次の式がありました。  (?<=^|。)[^。]+。 日本語の文章の中から一文を抽出するための正規表現です。  。以外の文字がダーッと連なった後に。が来る文字列 とのことです。  [^。]は。以外の文字  +はそれが1個以上ある ですから  [^。]+ は  。以外の文字が1個以上ある という意味です。 その後に。が付きますから、  [^。]+。 だけで  。以外の文字がダーッと連なった後に。が来る文字列 ということになります。 では  (?<=^|。) の意味は何でしょう。  (?<=なんたら) は後方参照を意味しますから、 ^|。 のすぐ後に [^。]+ が続くと言いたいのでしょうか。 だとすると  ^|。 が問題です。  ^もしくは。 という意味なら、^は正規表現で記号として使われている文字ですから、  \^|。 と表現されそうなものです。 それに、。は文末でしか利用されない文字ですから、これに注目して検索を行うというのは理解できますが、^は日本語でなんら特徴を持つ文字ではありません。  ^もしくは。 という理解は間違いでしょう。 それでは^を記号として考えるとして、その前後を[]で囲んでいないから、この^は文字列の先頭を表すのでしょうか。そうすると件の正規表現は  先頭の|。のすぐ後から。以外の文字が連なった後に。が来る文字列 という意味になります。日本語の一文を抽出する正規表現という解説にかなり近づいてはいます。 しかし  |。 とは一体何? |はorを意味する記号ですが、  何とか or 。 という意味でしょうか。 でも「何とか」は「何とか」なりに何か文字表現がなされていても良さそうですし、それに  先頭の「何とか」または。のすぐ後から・・・ という解釈は意味不明。  |。 はどのように解釈すべきなのでしょうか。 お手数をお掛けします。

    • ベストアンサー
    • Perl
  • 正規表現で5文字切抜き

    正規表現で5文字切抜き 正規表現について悩んでいます。秀丸エディタで正規表現を使いたいと思っています。 各行に任意の文字列(スペース、ハイフン、カンマ、アンダーバー、半角全角英数等含む)があります。 先頭行から5文字を残して残りは削除したいと思います。 5文字以下はそのまま残したいと思います。 例) aaaaabb⇒aaaaa ab cdef⇒ab cd a ⇒ a aa⇒aa 「^.{1,5}」とやると、先頭から5文字選択できるのはわかります。 「^.{1,5}(?=.+)」とやっても選択できるのはわかります。 ただし、6文字以上は削除とした場合、どのように正規表現を組み立てればよいでしょうか?

  • 正規表現についての質問です。

    正規表現につての質問です。 今テキストファイルに下記のような漢字と数字が並んでいます。 そこから、漢字一文字だけの行を抜き出してきたいのですが、うまくいきません。PerlとCygwinを使用しています。よろしくお願いします。 人584504122 情報542701982 商品510342870 日414551872 方347990908 者347069359 中339925319 表示330177395 的324961911 私323727263 検索291502623 見ル285226619 場合275698771 一256241900 利用253752129 年240881734 時239273060 前228762989 店225241510 登録224560617   ・   ・    ・ プログラム中身 #! /usr/bin/perl -w #テキストから指定した単語などとマッチすると、 #その単語を含んだ文を抜き出してくる。 while(<>){ s/ +//g; s/\s+//g; if(/^([亜-煕]|[一-龠]){1}[0-9]*/){ print; print "\n"; } }

  • 正規表現での検索で・・・・

    Dreamweaverで検索する場合なのですが、 例えば「1月1日」から「1月31日」までと言った単語を検索しようとする場合、どのように検索すれば良いでしょうか。 上記ソフトのヘルプをみると、正規表現での検索で出来ると書いてあるのですが、ワイルドカード「?や*」(でしたっけ?)の使い方が良く分かりません。もし正規表現による検索が分かりやすいサイトなどあれば、合わせて教えていただければ幸いです。

  • 漢字を含んだ正規表現

    お世話になってます。 漢字を含んだ文字列を正規表現でマッチさせたいのですが 以下のようなテキストから 「あいうえおあいうえお、あいうえおあいうえお、あいうえおあい あいうえおあいうえお、あいうえおあいうえお、あいうえおあいう hello,my name is tetetあいうえおあいうえおeららららら frisk02様あえおあいうえお、あいうえおあいうえお、あいうえお」 「frisk02様」もしくは「frisk02」(この部分は英字もしくは数字を含んだ文字列となります)をマッチして取得したいのですが 有効な正規表現がわかりません、教えてください。お願いします。

    • 締切済み
    • PHP
  • Perlで使える正規表現を教えて下さい。

    Perlで使える正規表現を教えて下さい。 半角英語で、小文字が3文字以上続いた後、大文字が来る場合、その大文字の右にスペースを入れる。 これをPerlで使える正規表現を教えて頂けないでしょうか? 例 $str = 'AaaAaaaBbbbbCccccDddBbA'; # Aaa Aaaa Bbbbb Ccccc DddBbA ちなみに、色々ネットで調べて試してみて、 $str =~ s/([a-z])([A-Z])/$1 $2/g; が最も近いコードになったのですが、2文字続いただけでもスペースが入り困っています。 宜しくお願い致します。

    • ベストアンサー
    • Perl

専門家に質問してみよう