• ベストアンサー

py --json -q -o extracted

./wikiextractor/WikiExtractor.py --json -q -o extracted enwiki-latest-pages-articles.xml.bz2をUbuntu18で実行する方法を教えてください 実行できません フォルダーはあるのにいつもエラーをおこします  enwiki-latest-pages-articles.xml.bz2は16GBです

  • Python
  • 回答数5
  • ありがとう数1

質問者が選んだベストアンサー

  • ベストアンサー
  • _kappe_
  • ベストアンサー率68% (1522/2216)
回答No.5

>WikiExtractor.py: error: unrecognized arguments: –q /mnt/c/Windows/System32/enwiki-latest-pages-articles.xml.bz2 >でエラーになります これは失礼しました。 「–q」の「–」が普通のマイナス記号ではありませんね。回答No.1の補足に書かれていたものをコピーしましたが、見落としました。 それから、「--json」オプションは使えないようです。 python3 -m wikiextractor.WikiExtractor -q -o extracted /mnt/中略/enwiki-latest-pages-articles.xml.bz2 ではどうですか。入力ファイル名は異なりますが、動くことを確認しました。

その他の回答 (4)

  • _kappe_
  • ベストアンサー率68% (1522/2216)
回答No.4

wikiextractorってhttps://github.com/attardi/wikiextractorから取ってきたツールでしょうか。 試してみたら確かに「ModuleNotFoundError: No module named '__main__.extract'; '__main__' is not a package」のエラーが出ました。 しかし、https://github.com/attardi/wikiextractor/blob/master/README.mdを読むと実行方法が違うようです。参考にしていたものが古いとか、必要な手順を飛ばしたりとかしていませんか。 Ubuntu 20.04にwikiextractorをインストールしてみました。 1.もしUbuntuにpipがインストールされていない場合はpipをインストールする sudo apt install python3-pip 2.pipを使ってwikiextractorをインストールする python3 -m pip install wikiextractor 3.wikiextractorを起動する 質問者さんの場合は下記のコマンドで実行できるだろうと思います。 python3 -m wikiextractor.WikiExtractor –-json –q -o extracted /mnt/c/Windows/System32/wikiextractor/enwiki-latest-pages-articles.xml.bz2

  • _kappe_
  • ベストアンサー率68% (1522/2216)
回答No.3

>ls -l /mntでファイルにアクセスできますがpy –json –q -o extractedコマンドを実行するとエラーになります >a@a:~$ python3 mnt/c/Windows/System32/wikiextractor/wikiextractor/WikiExtractor.py –json –q -o extracted mnt/c/Windows/System32/wikiextractor/enwiki-latest-pages-articles.xml.bz2 >python3: can't open file 'mnt/c/Windows/System32/wikiextractor/wikiextractor/WikiExtractor.py': [Errno 2] No such file or directory 上記コマンド中に2ヶ所あるmntの前にスラッシュ(/)が足りません。 /mnt/c/Windows/以下略のようにファイルパスを指定してください。 ls -lを実行したときにはつけていたのに、python3の実行の時にはどうして消してしまったのでしょうか。

nakanakaokwave
質問者

補足

上のようにしましたが a@a:~$ ls -l /mnt/c/Windows/System32/enwiki-latest-pages-articles.xml.bz2 -rw-r--r-- 1 a a 18084129415 Jan 3 12:13 /mnt/c/Windows/System32/enwiki-latest-pages-articles.xml.bz2 a@a:~$ python3 -m wikiextractor.WikiExtractor –-json –q -o extracted /mnt/c/Windows/System32/enwiki-latest-pages-articles.xml.bz2 usage: WikiExtractor.py [-h] [-o OUTPUT] [-b n[KMG]] [-c] [--html] [-l] [-ns ns1,ns2] [--templates TEMPLATES] [--no-templates] [--escapedoc] [--processes PROCESSES] [-q] [--debug] [-a] [-v] input WikiExtractor.py: error: unrecognized arguments: –q /mnt/c/Windows/System32/enwiki-latest-pages-articles.xml.bz2 でエラーになります

  • _kappe_
  • ベストアンサー率68% (1522/2216)
回答No.2

追加の確認事項です。 ・WikiExtractor.pyの最初の行には何が書かれていいますか。質問文に書かれている方法で実行するには、下記のようなシェバン(shebang)と呼ばれる行が1行目に必要です。  #!/usr/bin/env python3 ・WikiExtractor.pyのファイル属性はどうなっていますか。実行可能属性がないと"Permission denied"というエラーが出るはずです。 「python3 wikiextractor/WikiExtractor.py --json (以下略)」のように実行するコマンド名(python3)を明示的に書くなら、上記のシェバンや実行可能属性は不要です。

nakanakaokwave
質問者

補足

a@a:~$ python3 /mnt/c/Windows/System32/wikiextractor/wikiextractor/WikiExtractor.py –json –q -o extracted mnt/c/Windows/ System32/wikiextractor/enwiki-latest-pages-articles.xml.bz2 Traceback (most recent call last): File "/mnt/c/Windows/System32/wikiextractor/wikiextractor/WikiExtractor.py", line 66, in <module> from .extract import Extractor, ignoreTag, define_template, acceptedNamespaces ModuleNotFoundError: No module named '__main__.extract'; '__main__' is not a package エラーになります

  • _kappe_
  • ベストアンサー率68% (1522/2216)
回答No.1

>フォルダーはあるのにいつもエラーをおこします まずは ・何というエラーメッセージが出ているのか ・何のフォルダー(ディレクトリ)がどこにあるのか ・「ls -l ./wikiextractor」コマンドを実行したらどういう結果になるか を補足してください。 「./」がカレントディレクトリの指定であることは理解していますか? それから、以前の質問は適宜締め切ってください。 https://okwave.jp/qa/q9846126.html https://okwave.jp/qa/q9847829.html 以前の質問を締め切らずに新しい質問を投稿するのはガイドライン違反です。 https://guide.okwave.jp/guide/prohibition.htmlから引用します。 >1つのテーマについて複数の質問に分割して投稿する行為や、前回投稿した同様の質問を締め切らずに関連質問の追加情報を新たに質問として投稿する行為は、回答者がどの質問に回答すればいいか分からなくなるなど迷惑となるおそれがありますので、禁止とさせていただきます。

nakanakaokwave
質問者

補足

a@a:~$ ls -l /mnt/c/Windows/System32/wikiextractor/wikiextractor/WikiExtractor.py -r-xr-xr-x 1 a a 23150 Jan 18 19:12 /mnt/c/Windows/System32/wikiextractor/wikiextractor/WikiExtractor.py a@a:~$ ls -l /mnt/c/Windows/System32/wikiextractor/enwiki-latest-pages-articles.xml.bz2 -rw-r--r-- 1 a a 18084129415 Jan 3 12:13 /mnt/c/Windows/System32/wikiextractor/enwiki-latest-pages-articles.xml.bz2 ls -l /mntでファイルにアクセスできますがpy –json –q -o extractedコマンドを実行するとエラーになります a@a:~$ python3 mnt/c/Windows/System32/wikiextractor/wikiextractor/WikiExtractor.py –json –q -o extracted mnt/c/Windows/System32/wikiextractor/enwiki-latest-pages-articles.xml.bz2 python3: can't open file 'mnt/c/Windows/System32/wikiextractor/wikiextractor/WikiExtractor.py': [Errno 2] No such file or directory

関連するQ&A

  • WikiExtractor.py --json -

    ./wikiextractor/WikiExtractor.py --json -q -o extracted enwiki-latest-pages-articles.xml.bz2 がubuntu18で a@a:~$ python3 -m wikiextractor.WikiExtractor -q -o extracted /mnt/c/Windows/System32/enwiki-latest-pages-articles.xml.bz2 Segmentation fault (core dumped) とエラーを起こします 改善方法を教えてください

  • .py --json -q -o extracte

    win8付属のコマンドプロントでpython3,6 python --versionコマンドでパスは確認できます win8で~.py --json -q -o extracted ~.xml.bz2のコマンドを実行する方法を教えてください win8コマンドプロント C:\WINDOWS\system32>python./~.py --json -q -o extracte d ~.xml.bz2 'python.' is not recognized as an internal or external command, operable program or batch file.

  • gnuplot.py について

    目的:pythonで数値計算した結果をgnuplotで出力したい。 要点:Gnuplot を import できてもグラフを表示できない。 OS : Mac OS X 10.5 まず、SorceForge から ・numerical python (numpy-1.5.1-py2.7-python.org-macosx10.3) ・gnuplot.py (gnuplot-py-1.8.tar) をダウンロードしました。 次にterminalで上のそれぞれのファイルがあるディレクトリにいって、 >> python setup.py install としました。どうやら成功した模様です。 numpy と Gnuplot というフォルダが /Library/Frameworks/Python.framework/Versions/2.7/lib/python2.7/site-packages/ というディレクトリにできています。 そして、IDLE の python shell で >>> import numpy >>> import Gnuplot としました。無事完了します。ここまではOKです。 しかし、試しに python shell から gnuplot で表示してみようとすると、IOError: [Errno 32] Broken pipe というエラーを表示します。たとえば、上に書いたディレクトリのGnuplot というフォルダの中に、test.py というスクリプトがあって、IDLE で開いて実行すると、次のような表示が出ます: This program exercises many of the features of Gnuplot.py. The commands that are actually sent to gnuplot are printed for your enjoyment. Popping up a blank gnuplot window on your screen. Press return to show results... Traceback (most recent call last): File "/Library/Frameworks/Python.framework/Versions/2.7/lib/python2.7/site-packages/Gnuplot/demo.py", line 110, in <module> demo() File "/Library/Frameworks/Python.framework/Versions/2.7/lib/python2.7/site-packages/Gnuplot/demo.py", line 28, in demo g = Gnuplot.Gnuplot(debug=1) File "/Library/Frameworks/Python.framework/Versions/2.7/lib/python2.7/site-packages/Gnuplot/_Gnuplot.py", line 187, in __init__ self('set terminal %s' % (gp.GnuplotOpts.default_term,)) File "/Library/Frameworks/Python.framework/Versions/2.7/lib/python2.7/site-packages/Gnuplot/_Gnuplot.py", line 210, in __call__ self.gnuplot(s) File "/Library/Frameworks/Python.framework/Versions/2.7/lib/python2.7/site-packages/Gnuplot/gp_macosx.py", line 144, in __call__ self.flush() IOError: [Errno 32] Broken pipe 他のスクリプトを実行してみると、次の4つを除き正常に実行されます; _init.py, demo.py, test.py, gp_mac.py ただし、gp_mac.py だけは IOError: [Errno 32] Broken pipe ではなく、 ImportError: No module named Required_Suite というエラーです。 何が原因でしょうか?これを解決するにはどうしたらよいのでしょうか?

  • ファイルの展開?解凍?

    jawiki-latest-pages-articles.xml っていうデータをダウンロードしたんですが、展開?解凍? の仕方がわかりません。 いちようLhaplus Version 1.59っていうのがあるんですが、これが使えるのかもさっぱりわからないので 丁寧な解説をお願いします。 パソコンは7です。

  • python codeが 実行出来ない

    簡単なテスト用のpython code(sample.py)を実行するのにエクスプローラーから選択しダブルクリックで立ち上げるとVisual studio codeが立ち上がり、実行できるのですが、Visual Studio Codeを立ち上げ、フォルダーを選択し、そこからsample.pyを実行すると添付図の状態となり、エラーメッセージもなく停止状態になります。 他の****.pyを選択して実行しても同様です。 一度、当該フォルダーを閉じ、別のフォルダーを開いた場合、複数の***.pyがあっても、選択して、夫々実行可能となります。 この例示のch8フォルダーが壊れているという状態ではありません。 何が原因と考えられますか?

  • Linux Fedora8を使っています。System-config-securitylevelが実行できなくなりました

    system-config-securitylevelが突然実行できなくなりました。今までは普通に実行でき、ファイアーウォールの設定ができていました。しかし今回実行しようとすると、 /usr/share/system-config-firewall/fw_gui.py:49: GtkWarning: Invalid input string xml = gtk.glade.XML(DATADIR + "/" + GLADE_NAME, domain=domain) というエラーメッセージのようものがでて、実行できません。 これが起こる前までに行っていた作業は、yum install postfixをし、/etc/postfix/main.cfを設定していました。 そして設定が完了して、ファイアウォールでポートを開けようとして、system-con~を実行しようとした所上記のエラーがでるようになりました。試しにpostfixをアンインストールしても変わりませんでした。 どうすれば改善できますでしょうか?よろしくお願いします。

  • HPにスペースは使っちゃダメ?

    HPがGOOGLEウェブマスターツールでエラーがでます。登録したサイトマップで下記のようなメッセージが出てしまいます。 -------------------------------------------------------------------------------- XML ページを表示できません XSL スタイル シートを使用した XML 入力は表示できません。エラーを訂正してください。 [更新] ボタンをクリックするか、または後でやり直してください。 -------------------------------------------------------------------------------- セミコロン ( ; ) が必要です。リソース 'http://○○○○○.com/sitemap.xml' の実行エラーです。ライン 312、位置 43 <loc>http://○○○○○.com/fx_q&a_fx vs bank.html</loc> -------------------------------------------------------------------------------- これはもしかして、ファイル名に空白スペースを使っているからでしょうか?

  • Syndicate this site (XML) は何ですか?

    Movable Type3.3でブログを運用しています。 配布されているテンプレートを使ったのですが サイドバーの下に「Syndicate this site (XML)」というリンクが あり、クリックすると別ウインドウが開いて「Webページがみつかりません」というエラーになります。 エラーページのアドレスは http:私のサイトのアドレス/index.rdf となっています。 Q1:Syndicate this site (XML)の機能は何ですか? Q2:正常に機能させるにはどうすれば良いですか?    よろしくお願いします。

  • I/Oデバイスエラー

    つい先ほどパソコンを再起動し、ローカルディスクを見ようと思ったら、「I/Oデバイスエラーの為、要求を実行できませんでした」と出て、見れませんでした。 また、「稼動中」を示すランプも定期的に光り、右クリックしてメニューを呼び出すのも異常に遅くなっています。 これって、ディスクが壊れたって事でしょうか? でもだとしたら、こうやって普通にインターネットが出来るのが不思議で・・・。 どなたか解決方法を知っていたらお教え下さい。 スペックはXPSP2、ソニーのVAIO-PCVJX10で、メモリは256MB、HDは80GBです。

  • ubuntu でthunderbird2.0.0xをインストールできない

    Ubuntu 7.10でメーラーソフトのThunderbird2系をインストールしようとしてもうまくできません。 thunderbird2のインストールファイル(linux用)をダウンロードして解凍後、そのフォルダの thunderbirdを実行しても立ち上がらず、 sudo apt-get install thunderbirdを実行してもパッケージがないと エラーになりインストールできません。 どなたかubuntuでthunderbirdのセットアップがうまくいったかたいらっしゃいましたら教えてください。

専門家に質問してみよう