• ベストアンサー

文字列が連続しているかどうか調べたいのですが、良い方法はないでしょうか

文字列が連続しているかどうか調べたいのですが、良い方法はないでしょうか? ExcelVBAです。 例えば"abc12saaa"などと文字列があって、4文字以上同じ文字が連続したいるか、4文字以上順番になっている文字があるかを調べるにはどのような方法があるでしょうか。 順番になっている文字とは"abcde"とか"1234"のようなものです。 1文字ずつ取り出して比較したり、1文字ずつAsc関数で数値化すればできるとは思いますが、スマートな方法、既存の関数とかないでしょうか。 よろしくお願いします。

質問者が選んだベストアンサー

  • ベストアンサー
  • kagakusuki
  • ベストアンサー率51% (2610/5101)
回答No.4

 単純に4文字以上連続した文字の有無を判定するだけで、連続部分の抽出等は行わない場合には、次の様な方法があります。  今仮に、文字列がA3セルに入力されているものとしますと、判定結果を表示させるセルに、次の数式を入力すると良いと思います。 =IF(SUMPRODUCT((SUBSTITUTE(A3,MID("abcdefghijklmnopqrstuvwxyz",ROW(B$1:B$23),4),)<>A3)*1)+SUMPRODUCT((SUBSTITUTE(A3,MID("0123456789",ROW(B$1:B$7),4),)<>A3)*1)>0,"有","無")  IF関数の論理式部分にある SUMPRODUCT((SUBSTITUTE(A3,MID("abcdefghijklmnopqrstuvwxyz",ROW(B$1:B$23),4),)<>A3)*1) の部分は、 abcdefghijklmnopqrstuvwxyz という文字列の先頭から、毎回1文字ずつずらしながら、連続した4文字を取り出し、その取り出した文字列と同じ並び方になっている部分を、A3セルに入力されている文字列から削除した際に、A3セルに入力されている文字列とは異なる文字列となる場合が、何回あるのかをカウントする数式です。  同じく SUMPRODUCT((SUBSTITUTE(A3,MID("0123456789",ROW(B$1:B$7),4),)<>A3)*1) の部分は、 0123456789 という文字列の先頭から、毎回1文字ずつずらしながら、連続した4文字を取り出し、その取り出した文字列と同じ並び方になっている部分を、A3セルに入力されている文字列から削除した際に、A3セルに入力されている文字列とは異なる文字列となる場合が、何回あるのかをカウントする数式です。  尚、 abcdefghijklmnopqrstuvwxyz は半角の小文字の文字列ですから、上記の数式のままでは、全角文字や大文字の場合には対応していませんが、 +SUMPRODUCT((SUBSTITUTE(A3,MID("ABCDEFGHIJKLMNOPQRSTUVWXYZ",ROW(B$1:B$23),4),)<>A3)*1) という数式を付け加えれば、半角の大文字にも対応する様になりますし、 +SUMPRODUCT((SUBSTITUTE(A3,MID("abcdefghijklmnopqrstuvwxyz",ROW(B$1:B$23),4),)<>A3)*1) という数式を付け加えれば、全角の小文字にも対応する様になります。  同様に 0123456789 も半角数字ですから、上記の数式は全角数字には対応していませんが、こちらも同様に全角数字の数式を付け加えれば良いわけです。

Hirorin_20
質問者

お礼

ありがとうございます。 知らない関数でその理解、さらに組み合わせて理解するのに手間取りました。 すごい処理ですね。

その他の回答 (3)

回答No.3

前から文字を切り取りながら判定するしかないと 思います。 関数とかないんじゃないかな。。。 ただ、私なら1文字づつではなく 「ab」をまづ切り取り、連続しているか調べます。 連続していれば、1文字追加して「abc」が連続しているかを調べます。 これを繰り返すと「abc1」の時点で連続ではなくなるので 「1」の文字列の位置からまた2文字取り出し。。。という感じではないでしょうか。

Hirorin_20
質問者

お礼

ありがとうございます。 自前でチェックするのも工夫すればループ回数が少なく済むということですね。

  • layy
  • ベストアンサー率23% (292/1222)
回答No.2

1文字ずつの判定が無難と思います。 "abc12saaa"から9文字 いきなり "abc"と"12"と"saaa"からに分けることができるかといったら厳しいように思います。 "ab"、"abc"、"abc1"ときて、"abc"が並んでいたことが分かる。 "1"、"12"、"12s"ときて、"12"が並んでいたことが分かる。 こうしてみると文字の後から見るのがよいかもしれません。 "12s"から"12"となれば2回繰り返しで判定ができますし。 "1234"は4回繰り返しで判定ができますし。 スマートになるかどうかは、どのくらい規則性があるか、で ほぼ決まるのでは?。

Hirorin_20
質問者

お礼

ご回答ありがとうございます。 内容は簡単なことで、既存関数がありそうな気がしたのですがないのでしょうか。

  • imogasi
  • ベストアンサー率27% (4737/17070)
回答No.1

VBAにはInstr関数があります。 単語(文字列)が連続しているかなら 定数で、abc・・・xyzと1234567890と言う定数を定義して、その定数に対しその単語でInstrをかければ、結果が0でなければ、質問の状態があると言えるのではないでしょうか。 サイクリックに考えるなら、abc・・・xyzabc・・・xyzになるのかな。数字の方は12345678901234567890。0が先頭か最後が適当かは考えてください。 単語でなく、文字列の1部でそれを調べるなら(注)、数字や英字の連続する範囲の文字列を切り出して、それの各々について前記を繰り返せば良いのでは。 「数字や英字の連続する範囲の文字列を切り出」すのが、1文字ごとの判別以外にはよい方法が無いかもしれないが。Regexp(正規表現)を使えば、考え方は少しはすっきりするかもしれないが、全体的には、プリミチブな方法と比べてあまり少ない行数にならないかも。 参考 http://codezine.jp/article/detail/1655 なおエクセル関数ではぴったりのものは無いと思う。 (注)abc12saaaならabcと12とsaaaに分けて、それぞれで、「連続」を考えるようなこと

Hirorin_20
質問者

お礼

ありがとうございました。

Hirorin_20
質問者

補足

ご回答ありがとうございます。 Instr関数は指定した文字列(Aとします)内に、指定した文字列(Bとします)があるかないかがわかるのだと思います。 Aの指定はよいのですが、Bのほうがちょっと違います。 同一文字がN個連続する、あるいは連続した文字がN個続くかのチェックですので、"AAAA"でも"BBBB"でも"CCCC"でもチェックしなければなりません。さらに、"BCDE"でも"CDEF"でも該当することになります。ですのでInstr関数では無理なのではないでしょうか。

関連するQ&A

専門家に質問してみよう