• 締切済み

HeartBeatフェイルバックError対処

HeartBeatフェイルバック時に発生するerrorについてです。 同じ症状に出会った方はいらっしゃるでしょうか? あまりにも情報が少なく、困ってます。 Heartbeat稼動テストにて master、slave共に稼動している状態でslave側のheartbeatをストップさせるとmasterのheartbeatがリロードされる時にpostfixがこける状態になってます。 [error内容] ResourceManager[7041]: ERROR: Return code 1 from /etc/init.d/postfix ResourceManager[7041]: CRIT: Giving up resources due to failure of postfix slave常時スタンバイ状態では、masterのフェイルバック、フェイルオーバーはうまく動作しています。 haresoucesファイルでpostfixの記述を削除している状態で試すと、全てうまく動作します。 ちなみにpostfixではなく、ipなど他のエラーもあると思いますが、postfixで引っかかった 人はいませんでしょうか?(対処の仕方が変わってくると思うので。) 同じ症状でクリアされた方、どうぞよろしくお願いしますm(_ _)m

みんなの回答

  • localica
  • ベストアンサー率52% (202/385)
回答No.1

同様の事象に遭遇したことはないけど、「/etc/init.d/postfix」でリターンコード1が返ってきているのだから、「/etc/init.d/postfix」を調べるべき。 適当に想像するとネットワークかPIDファイルのチェックのような気がする。

emporioarman1
質問者

お礼

回答ありがとうございますm(_ _)m 以前よりもpostfix周りを調査しているのですが、現在も原因をつかめていません。 (正常に動作している。エラーはもちろん見当たらない。) ですが、postfixが原因でひっかかっているのは間違いないでしょうね。 (logでもそうですし、実際postfixプロセスが走ってなければ、正常に作動するので。) localicaさんの考えるネットワーク、PIDファイルのチェック周りをもう少し 具体的に回答してもらってもよろしいでしょうか? よろしくお願いしますm(_ _)m

emporioarman1
質問者

補足

自己解決いたしました。 原因は、パッケージの足らないものがslave側にあり、同じ構成でpostfixを構築していないため、リソースがないという風にエラーが出ていたのでした。 ありがとうございましたm(_ _)m。

全文を見る
すると、全ての回答が全文表示されます。

関連するQ&A

  • heartbeatの設定がわかりません!!

    heartbeatの設定がわかりません!! メインからサブへ(フェイルオーバー)、サブからメイン(フェイルバック)へは通常通り動くのですが、メインとサブで稼働中にサブを落とすとメインも落ちてしまいます。 設定がおかしいのか?サブが落ちると冗長の意味が無くなるので停止するようになっているのか?どなたかご存じないでしょうか? よろしくお願いします。

  • HDD交換で起動時にエラー発生

    Primary master hard disk fail. HDD が故障したので HDD を改装しようと新しい HDD を購入しました。 新しい HDD を Primary MASTER に接続、他の HDD を Primary SLAVE に接続すると、 メモリチェック後に IDE に接続されている機器の認識はするのですが、 それ以降処理が進まず、ずっと待っていたら「Primary master hard disk fail.」と 表示される事がありました。 ちなみに、新しい HDD のみを Primary MASTER に接続して起動する事は確認しています。 起動といっても CD-ROM で復旧用 OS を起動するので、HDD での起動ではありませんが、 処理が進んでいるので問題ないと思っています。 また、ジャンパピンを MASTER/SLAVE 共に CS にし、IDE ケーブルの MASTER 側に、 新しい HDD を接続しても SLAVE で認識したり、新しい HDD を SLAVE 設定にすると正常に動作します。 これは、HDDの初期不良でしょうか。それとも IDE ケーブルや電源ケーブルの破損でしょうか。 また、MBR がらみの不具合でも、このような現象は発生するのでしょうか。

  • スレーブ側の仮想IPが作られません

    Linux初心者です。的はずれな質問を書いていましたらすみません。 [設定環境] CentOS6.4(64bit版) カーネル:2.6.32-358.6.1.el6.x86_64 pacemaker 1.0.12-1.el6.x86_64 heartbeat 3.0.5-1.1.el6.x86_64 postgresql9.2 9.2.4-1PGDG.rhel6.x86_64 現在、VirtualBox上で上記OS・ソフトを使い、Linuxクラスタの動作確認しています。 WEBで見たところ、crm_mon -Af を実行すると マスター側のpgsql-status が PRI と表示されるようなのですが、全く表示されず困っています。 これが原因なのかはわからないのですが、ip addr show  で確認したところ、slave側の仮想IPが作られていませんでした。 ※vip-master、vip-rep は作られています 仮想IPが作られない原因として考えられることを教えて頂けますとありがたいです。 よろしくお願いします。 ※postgresqlのconfファイルは文字数制限で貼り付けられませんでした。  すみません [IP] sv1 192.168.1.137 (サーバー名:CentOS1 ) sv2 192.168.1.138 (サーバー名:CentOS2) vip-master 192.168.1.130 vip-slave 192.168.1.135 vip-rep 192.168.64.10 [CRM] property \ no-quorum-policy="ignore" \ stonith-enabled="false" \ crmd-transition-delay="0s" rsc_defaults \ resource-stickiness="INFINITY" \ migration-threshold="1" primitive vip-master ocf:heartbeat:IPaddr2 \ params \ ip="192.168.1.130" \ nic="eth0" \ cidr_netmask="24" \ op start timeout="60s" interval="0s" on-fail="restart" \ op monitor timeout="60s" interval="10s" on-fail="restart" \ op stop timeout="60s" interval="0s" on-fail="block" primitive vip-rep ocf:heartbeat:IPaddr2 \ params \ ip="192.168.64.10" \ nic="eth2" \ cidr_netmask="24" \ meta \ migration-threshold="0" \ op start timeout="60s" interval="0s" on-fail="stop" \ op monitor timeout="60s" interval="10s" on-fail="restart" \ op stop timeout="60s" interval="0s" on-fail="block" primitive vip-slave ocf:heartbeat:IPaddr2 \ params \ ip="192.168.1.135" \ nic="eth0" \ cidr_netmask="24" \ meta \ resource-stickiness="1" \ op start timeout="60s" interval="0s" on-fail="restart" \ op monitor timeout="60s" interval="10s" on-fail="restart" \ op stop timeout="60s" interval="0s" on-fail="block" primitive pgsql ocf:heartbeat:pgsql \ params \ pgctl="/usr/pgsql-9.2/bin/pg_ctl" \ psql="/usr/pgsql-9.2/bin/psql" \ pgdata="/var/lib/pgsql/9.2/data/" \ start_opt="-p 5432" \ rep_mode="sync" \ node_list="CentOS1 CentOS2" \ restore_command="cp /var/lib/pgsql/9.2/data/pg_archive/%f %p" \ primary_conninfo_opt="keepalives_idle=60 \ keepalives_interval=5 keepalives_count=5" \ master_ip="192.168.64.10" \ stop_escalate="0" \ op start timeout="30s" interval="0s" on-fail="restart" \ op stop timeout="30s" interval="0s" on-fail="block" \ op monitor timeout="30s" interval="11s" on-fail="restart" \ op monitor timeout="30s" interval="10s" on-fail="restart" role="Master" \ op promote timeout="30s" interval="0s" on-fail="restart" \ op demote timeout="30s" interval="0s" on-fail="block" \ op notify timeout="60s" interval="0s" ms msPostgresql pgsql \ meta \ master-max="1" \ master-node-max="1" \ clone-max="2" \ clone-node-max="1" \ notify="true" primitive pingCheck ocf:pacemaker:pingd \ params \ name="default_ping_set" \ host_list="192.168.1.77" \ multiplier="100" \ op start timeout="60s" interval="0s" on-fail="restart" \ op monitor timeout="60s" interval="2s" on-fail="restart" \ op stop timeout="60s" interval="0s" on-fail="ignore" group master-group \ vip-master \ vip-rep \ meta \ ordered="false" clone clnPingd \ pingCheck location rsc_location-1 msPostgresql \ rule -inf: not_defined default_ping_set or default_ping_set lt 100 location rsc_location-2 vip-slave \ rule 200: pgsql-status eq HS:sync \ rule 100: pgsql-status eq PRI \ rule -inf: not_defined pgsql-status \ rule -inf: pgsql-status ne HS:sync and pgsql-status ne PRI colocation rsc_colocation-1 inf: msPostgresql clnPingd colocation rsc_colocation-2 inf: master-group msPostgresql:Master order rsc_order-1 0: clnPingd msPostgresql symmetrical=false order rsc_order-2 inf: msPostgresql:promote master-group:start symmetrical=false order rsc_order-3 0: msPostgresql:demote master-group:stop symmetrical=false

  • Postfixの起動出来ない

    現在RedHat AS2.1でメールサーバの構築を行っており、 Postfixを使用していますが、Postfixの起動時に 下記のエラーとなり、起動出来ていない状態です。 どのように回避すればよいか教えて下さい。 postfix/postfix-script: warning: /usr/lib/sendmail and /usr/sbin/sendmail differ postfix/postfix-script: warning: Replace one by a symbolic link to the other postfix/postfix-script: starting the Postfix mail system postfix/master[9030]: warning: process /usr/libexec/postfix/smtp pid 9060 exit status 1 postfix/master[9030]: warning: /usr/libexec/postfix/smtp: bad command startup -- throttling

  • lyrics master エラー

    lyrics master を使おうとしたら、うろ覚えなのですが、「他の人が使用している 103 ソケット? 」 といった内容のエラーが出て、使えませんでした。 以前は使えてました。 そして、その後、インストールしなおしたら直るかと思い試したところ、パソコンが急に熱くなり、重くて 動作もままならない状態(ファイルを削除をしようとすると、これまたエラーが出る状態です)になっていしました。 なんとかファイルは削除できて、パソコンも元に戻ったのですが、lyrics master が使えなくて不便です。同じことが繰り返されると考えると、再度インストールするのにはちょっと不安があります。 解決法を教えてください。 itunesに楽に歌詞をいれる他の方法があれば、教えてくださるとありがたいです。

  • コンパイルエラー???

    どなたか分かる方いらっしゃいましたら ご助言宜しくお願いします。 PHPソース自体には何も問題は無いのですが、たまにParse errorが出てしまいます。 「Parse error: syntax error, unexpected T_STRING, expecting ')' 」 エラーが出ても、何度かリロードを繰り返すと正しく表示されます。 なぜこのような現象がおきてしまうのか、調べても分からない状態です。 どなたか解決策をご存知の方宜しくお願いします。 動作環境 CentOS3.8 apache2.2.4 php4.4.8 Mysql5.0.27 文字コードはeuc-jpで統一

    • 締切済み
    • PHP
  • 勝手にバックスペースされる

    Windows7を使用中、キーボードに触れていないのに 勝手にバックスペースキーが入力されっぱなしの状態になります。 テキスト入力中ならカーソルより前の文字がどんどん消え、 ブラウザ使用中やフォルダ(エクスプローラー)表示中は前のページへ戻っていきます。 パソコン起動直後は発生せず、キーボードのバックスペースキーが効かない状態になります。 暫く経つと数十秒に数秒間の頻度で上記の症状が発生します。 また暫く経つと症状が止まり、バックスペースキーも正常動作するようになります。 正常動作までの時間はその時々です。(すぐ治ることもあれば長時間かかることもある) キーボードを替えても発生します。 変換ソフトはIMEの他にATOKを使っていますが、どちらでも発生します。 一度治った後も、パソコンを長時間電源を入れたまま放置した後操作する時、症状が出ることがあります。 パソコンをリカバリするしかないのでしょうか。 困っているので改善方法をご存知の方、お力をお貸しください。

  • ブルーバックが治らない

    自作PCを使用しており昨年5月まで快適に動作しておりました。 原因はあるフリーソフトをインストールしそのフリーソフトを実行していた時動きが非常に遅くなってしまい、 急いでいた為電源長押しでシャットダウンしてからです。 それ以来windowsを立ち上げる時にブルーバックになる確率は4/3ぐらいになってしまい(ブルーバック後はそのままの状態で再起動しない)、 ただ何度か電源を入れ直すと立ち上がるのでそのまま使用していたのですが、最近確率がどんどん上がってきたので OS再インストールを実行しました。 再インストールしてから1週間ぐらいは順調だったのですが、昨日再度ブルーバックになってしまいました。 ただ状況が多少異なっており、ブルーバック後勝手に再起動されます。(1秒ぐらいしかブルーバックになりません) その後windowsが立ち上がるかもう一度ブルーバックになるという状態です。 windowsが立ち上がるまでは再起動され続けます。 何度か試し一度起きた以降は何度も実証されました。 chkdskを行ったらエラーがかなり出て、/fを実行し再起動し再度chkdskを行っても何度もエラーが出ます。 これはもうハードディスクの不良という事でしょうか? また、ブルーバックの状況が当初のブルーバックのままの状態からブルーバック後すぐに 再起動がかかるという状態に変化したのは何が予測できるでしょうか。 現在はハードディスクを追加しそのハードディスクにwindowsを入れなおすしかないと考えていますが、 このまま修正できるのが理想です。 お手数ですが助言をお願いします。

  • アプリケーションのエラーです

    (エラーの内容) TMAS_OE applicationは、動作を停止しました 問題が発生したためプログラムが正しく動作しなくなりました。 というエラーが頻繁におきます。 何か解決する方法を教えて下さい。 それともう一つ最近たまに、ヤフーのホームページを開くときに応答しませんと出てきてずっと待っててもいつまでも応答しない状態がよくあります。ホームページの再起動をやればちゃんと見れる様になるのですが、なぜそういう症状になるようになったのか、それも解決策があるのであれば教えて下さい。

  • Postfixで送信ができない

    /var/log/syslog 10:33 solaris postfix/smtp[18719]: [ID 947731 mail.crit] fatal: open database /etc/postfix/saslpasswd.db: No such file or directory 10:34 solaris postfix/master[18715]: [ID 947731 mail.warning] warning: process /usr/libexec/postfix/smtp pid 18719 exit status 1 10:34 solaris postfix/master[18715]: [ID 947731 mail.warning] warning: /usr/libexec/postfix/smtp: bad command startup -- throttling となっているのですがsaslpasswdはあります。saslpasswd.dbにするために何かコマンドを打つ必要があるのでしょうか? また、後に出ているsmtpのエラーがよくわかりません、参考になるサイトなどご紹介いただけると幸いです /etc/postfix/main.cf alias_maps = dbm:/etc/mail/aliases command_directory = /usr/sbin config_directory = /etc/postfix daemon_directory = /usr/libexec/postfix debug_peer_level = 2 inet_interfaces = all mail_owner = postfix mail_spool_directory = /var/spool/mail mailq_path = /usr/bin/mailq manpage_directory = /usr/local/man mydestination = $myhostname, localhost myhostname = solaris mynetworks = 192.168.1.2, 127.0.0.0/8 myorigin = $myhostname newaliases_path = /usr/bin/newaliases queue_directory = /var/spool/postfix relayhost = [192.168.1.3]:587 sample_directory = /etc/postfix sendmail_path = /usr/lib/sendmail setgid_group = postdrop smtp_sasl_auth_enable = yes smtp_sasl_password_maps = hash:/etc/postfix/saslpasswd smtp_sasl_security_options = noanonymous smtpd_banner = $myhostname ESMTP $mail_name unknown_local_recipient_reject_code = 550 /etc/postfix/saslpasswd [192.168.1.3]:587 username:password