ベストアンサー

正規表現・lexによる字句解析器

2004/12/02 13:48

lexソースの中に次のようなコードが出てるんですが、左側の正規表現の意味がわからなくて困っています。文字列の解釈のコードだと思います。 \はバックスラッシュだと思ってください。 \"[^"]*\" { yytext[yyleng - 1] = '\0'; yylval.str = strdup(&yytext[ 1]); return(STRING); } (yaccのソースの中に&token <str> STRINGという記述が入っている) 文字列はダブルクォーテーション「"」で囲み、間に改行が入っても構わないそうです。 yytextは次の入力を処理するときに破壊されるので、ヒープ上に確保した領域に文字列を格納し、そのアドレスをyylval.strに渡す。初めと終わりの「"」は取り除く・・のだそうです。おそらくstrdupの説明だと思うのですが、Ｃ言語のマニュアルには載ってなかったですね・・・。

msndance
お礼率58% (351/604)

その他（プログラミング・開発）
回答数3
ありがとう数5

みんなの回答 （3）
専門家の回答

質問者が選んだベストアンサー

ベストアンサー

ranx
ベストアンサー率24% (357/1463)

2004/12/02 14:06 回答No.1

\"　　　　"の特別な意味を除いた、文字としての" [^"]* 　　"以外の文字の０回以上の繰り返しですので、 "を含まない０文字以上の文字列を"で囲んだものという意味になります。

質問者

補足 2004/12/02 14:17

含まないっていうのは、^で表現されているわけですか？

その他の回答 (2)

επιστημη（@episteme）
ベストアンサー率46% (546/1184)

2004/12/02 15:09 回答No.3

> すでに読んではいるのですが、それによると^は行頭だった気がします。読みが足りない。 []内のアタマにある'^'は意味が違います。 > それで、"を含まないっていうことを何で表しているのかが・・・ lex-scriptを書いた人が'文字列中には"を含むべからず'と決めたから。

質問者

お礼 2004/12/04 10:22

ありがとうございました。[^なんとか]の意味を確認しました。

質問者

補足 2004/12/02 15:32

＞読みが足りない。 []内のアタマにある'^'は意味が違います。すいません。家帰って調べなおします。

επιστημη（@episteme）
ベストアンサー率46% (546/1184)

2004/12/02 14:43 回答No.2

> 含まないっていうのは、^で表現されているわけですか？正規表現のマニュアル/ドキュメントは読んだのですか? 正規表現を知らずにlexコードを読むのは無謀というもの。

質問者

補足 2004/12/02 14:59

恐縮です。すでに読んではいるのですが、それによると^は行頭だった気がします。それで、"を含まないっていうことを何で表しているのかが・・・

正規表現・lexによる字句解析器