• ベストアンサー

javaでファイルの読み込み

javaであるファイルに保存してある文章を読み込みたいです。 その際に単語ごとに読み込みをしたいのですが、どうすればいいでしょうか? 読み込みファイルは、EUCコードの漢字で、各単語はTABで区切られています。 どなたか、よろしくお願いします。

  • Java
  • 回答数1
  • ありがとう数2

質問者が選んだベストアンサー

  • ベストアンサー
  • X-Terra
  • ベストアンサー率48% (25/52)
回答No.1

StringTokenizerクラスを利用するとよいのではないでしょうか。 以下は速攻で書いたもので正確ではないかもしれませんが。 byte byDataBuff[] = new byte[1024]; int nDataLen = 0; File fl = new File(strFileName); FileInputStream aObj = new FileInputStream(fl); nDataLen = aObj.read(byDataBuff); StringTokenizer stReadData = new StringTokenizer(new String(byDataBuff, 0, nDataLen), "\t\n"); while (stReadData.hasMoreTokens()){ System.out.println( stReadData.nextToken()); // ここで自由な処理を行う }

myrimyri
質問者

お礼

ご丁寧にありがとうございました! さっそく明日やってみます。

関連するQ&A

  • JAVAによるテキストファイルの読込み

    Javaでテキストファイルの読込みを行いたいのですが、 SJIS、EUC、UTFなど代表的な文字コードは問題なく読込み、 バイナリファイルを読込んだ場合、エラーと判定したいのですが なにか良い方法はありませんか? 例えば、ファイルの文字コードを取得したときに ファイルがバイナリファイルか否かを判定することは可能でしょうか。

    • ベストアンサー
    • Java
  • EUCで保存できない

    テキストの内容を「11111」とか「adfas」など 単純な内容を書き、保存する際に文字コードを「EUC」 改行コードを「CR+LF」に設定し保存しても 再度開くときにShift-jisになってしまいます。 もちろんそこで再度SJISになったファイルを EUCで保存し再読み込み・文字コード指定保存をしても 画面上はEUCになりますが 保存し、ウインドウを閉じて再度開くとShift-jisになってしまいます。 現在使用しているテキストエディターは terapadです。emエディターでも同様です。 通常のフリーで落ちている EUCで書かれたファイルを ダウンロードして開いてみると EUCで書き変えることが可能です。 なぜか新規にEUCでファイルが作れなくなってしまいました。 どなたかお詳しい方のお返事をお待ちしています。

    • ベストアンサー
    • HTML
  • ファイル読込について

    現在Javaを勉強していますが何分初心者の為、 わからない事があり質問させて頂きます。 Javaを使ってある固定長ファイルに対して、 読込とファイルの移動を行いたいのですが、 APサーバとDBサーバ とでコーディングの仕方は変わるのでしょうか? また、 どのようにコーディングすればよろしいのでしょうか? 質問がわかりづらく申し訳ありませんが、 ご教授願いませんでしょうか。

    • ベストアンサー
    • Java
  • JAVA ファイル読み込みで文字化け発生

    お世話輪になります。 JAVAでプログラムを作成しているのですが、文字化けが発生してしまいます。ファイルの読み込みには、apache.commons.ioのライブラリを使用しています。インターネット等で調べたのですが、調べた限りでは特にやり方に問題がないように思うのですが、特定のファイルを読み込もうとすると文字化けしてしまいます。 以下が実際のプログラムです。 import org.apache.commons.io.FileUtils; import org.apache.commons.io.LineIterator; ---------------------------------------------- 以下抜粋 ---------------------------------------------- LineIterator iterator = FileUtils.lineIterator("C:\aaa.txt", "EUC-JP"; while(iterator.hasNext()){ String line = iterator.nextLine().split(","); System.out.println(line); あるファイルは正しく読み込まれますが、あるファイルはよみこまれません。 どなたかご存知の方いらっしゃいませんでしょうか? 困っています。何卒よろしくお願いいたします。

  • EUCの文字化けについて質問です。

    EUCの文字化けについて質問です。 エディタは秀丸を使っています。 ・名前をつけて保存→文字コードをEUC ・その他→ファイルタイプ別の設定→保存読み込み→文字コードをEUC 上の二つを試しましたが、日本語を記入してあったところ(コメントにしてありました)が 漢字だらけになって表示されてしまいます。 半角英数の部分はきちんと表示されています。 プログラム上は支障はないとは思うのですが、 コメントが読めなくて困っています。 どうか良い解決法をお教え下さい! マシンはウィンドウズです。

  • nkfで全ファイルを変換する

    ネットで配布されているサンプルのJavaのソースコードが あるのですが、それが全部EUCではないので、EUCに 変換したいのです。 aというディレクトリの中に01から16、Rensyu というディレクトリがありその各々のディレクトリの 中に.javaとついたサンプルコードが入っています。 これをいっぺんに変換するのに nkf -e * > sample などとすると一つのファイルに全部変換後の ファイルがかかれてしまうので、 たとえばSampele1.javaだったらそれと同じ 名前のファイルに書き出すか、また Sample1_e.java というファイルに書き出したいです。 どうしたらいいでしょうか?おねがいします。

  • unicodeファイルの読み込み

    javaアプレット上で BufferedReader file = new BufferedReader(new FileReader("C:/test/list.txt")); で外部テキストファイルを読み込んでいるのですが、この外部テキストファイルの文字コードをANSIからUnicodeに変えるとプログラムが動かなくなります。日本語やアルファベットではない文字の保存のためにテキストをUnicodeにて保存しなければならないのですが、どうすればUnicodeのテキストファイルを読み込むことができますか。

    • ベストアンサー
    • Java
  • HTMLの文字コードについて

    メモ帳で作成したHTMLの漢字コードをEUCにしたいのですが、 保存の際に選択できません。 メモ帳ではEUCにできないのでしょうか?? できる方法を教えてください。

  • javaのファイル読み込み時の文字コードについて

    当方プログラム初心者です。 文字コードがSJIS以外(EUCなど)のテキストファイルをBufferdInputStreamで読み込み、readline()したものをprintlnすると、この時点でファイル内の文字が文字化けします。 環境はEclipseで、実行時はUTF-8でエンコードされるようになっています。 ファイルはサクラエディタで作成し、保存時に文字コードをEUCやSJISに設定しています(デフォルトではSJISで保存される)。 ファイル内の文字列は「ABCDE123アイウエオ」が入っている前提です。 BufferedReaderにInputStreamReaderをラップし引数に読み込みたい文字コードを指定してもダメ、文字コードの引数にJISAutoDetectを指定してもダメ、Eclipseの実行構成をテキストファイルと同じ文字コードにしてもダメでした。 取り急ぎで本当にすみません。皆様の知恵をお貸しください。。。

    • ベストアンサー
    • Java
  • javaでcsvファイル読込時の改行について

    javaでcsvファイルを読込・データ登録処理を作成しているのですが、 現在はjavaのreadLine()を使用して読込んでいます。 既存のreadLine()では\rまたは\n、および\r\nにて改行とみなしているようですが、 これを\r\nの場合のみ改行としたいと思っています。 どなたか良い方法をご存知でしたら教えてください。 初心者の為、説明が分かり難かったら申し訳ありません。 よろしくお願いします。

専門家に質問してみよう