• ベストアンサー

exelで一番初めに出てきたひらがな単語抽出方法

masnoskeの回答

  • ベストアンサー
  • masnoske
  • ベストアンサー率35% (67/190)
回答No.6

No.5の補足です. isKatakana プロシージャの "[ヲ-゜]" は,半角です. OKウエイブの仕様で全角に変換されるようなので,注意して下さい.

関連するQ&A

  • exelで各行最初のひらがなと漢字抽出

    exelで各行にあるひらがなと漢字と他の文字が混じったテキストの中から全行含めて一番初め、一番左側に出てきたひらがな、漢字単語だけ一括で抽出しあいている列に表示する方法を教えて下さい ひらがな、漢字単語はひらがな、漢字のあとにひらがな、漢字以外の文字が続くところより前の部分と判断したい 最大100文字 ひらがな、漢字が続く中のの句読点もすべて抜き出したい exelで各行にあるひらがなと漢字と他の文字が混じったテキストの中から全行含めて一番初め、一番左側に出てきたひらがな、漢字単語だけ一括で抽出しあいている列に表示する方法を教えて下さい

  • exel行の中で一番初めに出てきたカタカナ単語抽出

    exelで各行にあるカタカナと他の文字が混じったテキストの中から一番初めに出てきたカタカナ単語だけ一括複数で抽出したいのですが下の式を使うとカタカナ以外も抽出してしまいます マクロを含め各行にあるカタカナと他の文字が混じったテキストの中から一番初めに出てきたカタカナ単語だけを一括複数で抽出できる式を教えて下さい =MID(A1,MATCH(1,(CODE(MID(A1,COLUMN($A$1:INDEX($1:$1,LEN(A1))),1))>=9505)* (CODE(MID(A1,COLUMN($A$1:INDEX($1:$1,LEN(A1))),1))<=9590),0),SUM((CODE(MID(A1,COLUMN($A$1:INDEX($1:$1,LEN(A1))),1))>=9505)*(CODE(MID(A1,COLUMN($A$1:INDEX($1:$1,LEN(A1))),1))<=9590)))

  • exelの列でひらがな、漢字、カタカナをすべて選択

    exelの列でひらがな、漢字、カタカナの単語をすべて選択する方法を教えて下さい  半角、全角が混じったテキストです

  • EXELで「:」を区切り文字として読み込みたい

    EXEL2003です。 下記のようなメモがテキストファイルであります。 「:」を区切り文字としてEXELに取り込み、左側をA列に、右側をB列に入れたいのですが、 どうすればよいでしょうか。 名火消:寛永20年(1642) 定火消:明暦の大火  町火消:享保3年(1718)  石見銀山:大森銀山とも  よろしくお願いします。

  • exelの列で英単語をすべて選択する

    exelの列で英単語をすべて選択する方法を教えて下さい 半角、全角が混じっているテキストです 

  • exelで行の最初にあるカタカナ単語だけを抜き出す

    exelで行の最初にあるカタカナ単語だけを抜き出す方法を教えて下さい カタカナの単語と他の文字の単語の境目で分け、 2回めにカタカナが出てきた場合は抜き出さないようにしたいです

  • perlを使用しての特定行抽出について

    何万行も書いてあるテキストファイルがあります。抽出したい文字列の一覧がテキストファイルにまとめられています(文字列は約1000個)。抽出したい文字列は一行にひとつづつ書かれています。何万行も書いてあるテキストファイルから抽出したい文字列と二つ合致したらその行を抽出したいです。ここで、注意していただきたいのが、抽出したい文字列一覧から二つの文字列にヒットした行を抽出したいです。宜しくお願い致します。 何万行も書いてあるテキストファイル aaaaa abc edi bb aert kkkkkkkkkk lllllll ddddd aaaaa anhi kkk    ・・・・・・・・ ・・・・・・・・ 抽出したい文字列一覧のテキストファイル aaaaa bbbbb ddddd iiiiiiiii eeeee ・・・・・ ・・・・・

    • ベストアンサー
    • Perl
  • EXELの使い方について

    現在EXELで表を作成していて、横・縦ともに1ページに収まらず、10ページほどにわたる状態です。これで印刷すると、当然セルの1・2列と1行目に入っている項目名等が1ページ目以外には印刷されず、2枚目以降では1枚目と照らし合わせて確認しないといけない状態です。そこで、1・2列と1行目(項目の部分)をどのページにも自動的に印刷できるようにしたいと思っています。その方法をご存じの方がおられましたら、教えて頂けないでしょうか。

  • エクセル2003でセルの検索・抽出について

    A列に漢字・ひらがな・カタカナ・半角英数字・半角カナが入り混じった文字列が入力されていまして、 漢字・カタナカ・ひらがな・半角カナを含むセルのみ簡単に見つけたいのですが、どうしたらいいでしょうか?        A列        B列 1行目 123あ456a       ○ 2行目 123456AB       × 3行目 123亜456a       ○ 4行目 123ア456A       ○ 5行目 ABCD567        × 上記の例でいくと、2&5行目以外を抽出して、分かりやすく見つけたいのです。 たとえば2&5行目以外のセルに色をつけるとか、B列に○または×を入れるとかでかまいません。 逆に2&5行目に色をつける、でもOKです! どうぞよろしくお願いいたします。

  • 文字数の多い単語だけ抽出(多言語テキスト)

    英・仏・独語の多数のテキストファイルから12文字以上の単語だけ抽出したいのですが効率のよい方法はないでしょうか。 英語だけならテキストエディタの正規表現を使ったgrepで \w{12,} で12文字以上の単語を含む行を検索したうえで、\w{1,11} を空白と置換して削除してしまえばいいのですが(一緒に表示させるフルパスは別途消す必要がありますが)、仏・独語となるとイロイロ問題が出てきます。 例えば、仏語では a'bc'def のようなパターンの単語があります。これを単に検索するだけなら \w'\w+'*\w* で検索できますが、12文字以上と指定する方法がわかりません(アポストロフィがひとつだけなら \w'\w{10,} で12文字以上ということになるのですが…)。 そこで質問なのですが: 1. 上記の仏語のようにアポストロフィを2つ含む12文字以上の単語を抽出するにはどうしたらいいでしょうか。 2. そもそも12文字以上の単語を含む行をgrepしたうえで、11文字以下の単語を消去したりせずに、最初から12文字以上の単語だけを抽出する方法はないのでしょうか。 できれば、フリーウェなどを導入せずにテキストエディタやOffice系アプリなどだけで対処したいと思います。VBSでもOKですが、その場合は、初歩的なことしかわかりませんので、アドヴァイスというより丸投げしてしまうことになります。 どうかよろしくご助言をお願いします