ベストアンサー

メニーコアアーキテクチャ

2009/02/11 02:40

メニーコアアーキテクチャに必要なOSとアプリケーションは、どうあるべきかを互換性の問題を含めて、考察せよ。という問題が大学で出ました。丸投げなんですけどどうあるべきなのか、どんな答えでもいいので教えて下さい。メニーコアアーキテクチャとは、CPUの数自体を増やすことによって性能の向上を図ることだそうです。（ネットで調べました。）

jappy-
お礼率8% (2/23)

その他(OS)
回答数2
ありがとう数1

みんなの回答 （2）
専門家の回答

質問者が選んだベストアンサー

ベストアンサー

和泉博（@hiroshi09s）
ベストアンサー率54% (59/109)

2009/02/11 18:22 回答No.1

　まず先に、情報処理学会Fit2006のイベント企画「これからが面白いプロセッサアーキテクチャ」を先にgoogle検索して内容を確認して下さい。２年半前の見解によれば、「コアの数なんてどうでもいい」も十分説得力のある回答のようにも思われます（お粗末ですが）。冗談はともかく、最近の見解では次のように考えられます。　many-coreはSONYとIBMが開発してゲーム機のプレイステーションに搭載してあるヘテロジニアスなものではなく、同じCPUを並べたホモジニアスなコアとなることが決まってきたようです。理由はいろいろあると思いますが、やはり同じCPUを並べた方がプログラミングし易いのは明らかで、癖がないことを理由に選んだ結果であろうと思われます。　昨年の９月末に、ネットのニュースで、many-coreを今年中半期には８個のmulti-coreの出荷が始まるが、データ並列は実現されているもののタスク並列が依然として解決されていない旨の報道が相次いでなされました（goole検索「止まらないメニーコアの流れと課題」）。今まで、Intelの宣伝によればhyper threadingの技術でmulti-coreなども問題なく対応できるかのごとくなされていたし、事実私たちもそう考えていました。この半年後のmulti-core出荷というときに「データ並列は対応できているが、タスク並列は実現されていない」との矢継ぎ早の報道は、寝耳に水といったところです。これが、情報処理学会Fit2006の見解が生まれた背景となっています。　では、「many-coreにソフトウェアがまだ対応していないのか？」と云えば、実は誰も知らないだけのことで、それがあるようです。英語版google.comで「unix scalar programming」を検索して下さい。そのトップページの最初のpdfファイルを見て下さい。そこの３ページ目にソフトウェアのあるべき姿が図示されています。すなわち、アプリケーションはC言語で作成し、各アプリケーション間のコミュニケーションはシグナルを使って同期をとって行うものです。すべての実行アプリケーションはセキュリティによって厳しく守られているため、ハードウェアの視点からみれば、アドレス線やデータ線（まとめてbusという）はOSによって制御されているため、一般ユーザからの制御は許されません。唯一残っているのはシグナル線だけなのです。Linuxでしたら「ctrl+c」、windowsでしたら、ウィンドウズが消えないため「閉じる」という表示をマウスでクリックする動作がシグナル線の操作に相当します。ついでに図を補足しますと、この事例の上の図がIntelのいうデータ並列に相当します。下の図がIntelなどが出来ないと騒いでいるタスク並列に相当します。　このような操作は、プログラミング環境が整っていなければなりません。google.comのpdfファイル最後の５ページを見て下さい。例えば、AとBという２つのアプリケーションを動かす場合を考えましょう。OSから見れば、AとBは実行形態としてプロセスという単位で管理しています。single CPUの場合、プロセスはCPUが１つであるため、round robinという巡回方式を採用して時間を細かく切って割り振って、わざわざA∩Bとならないように取りはからっています。例えば、割り当てられたプロセスはその割り当てられた0.05秒を実行したあと、さまざまなプロセスが実行された後、そのプロセスの実行まで待たねばなりません。その間、プロセスの実行は止められ、memory stackに退避させられて出番を待っています。many-coreになると、このround robinの次の順番待ちが解消され、常時CPUは稼働状態になります。もちろん、プロセスAとBは、A∩Bではない関係を保持しています。singleの0.05秒のために待ちながら処理するか、それともmanyの常時稼働状態で処理するかのどちらが処理能力が高いかを考えると良いでしょう。　thread技術は、このmany-coreで割り当てられるプロセスをタスクとして占有して処理するハードウェア技術です。round robinでその都度、OSが実行時間を確認しているのですが、その都度、タスクが裏で実行されているタスクさえも切り替わってしまうことになり、single CPUでは問題にならなかった問題が目に付くようになってきたのです。そもそも、たった１つのプロセス（プログラムを走らせた状態）で内蔵coreすべてを稼働させることじたい、誤りなのです（utube 検索「3.14159」参照）。すなわち、thread技術はA∩Bという使い方をしているし、そうしていたということです。　したがって、ソフトウェアはAやBの実アプリケーションの真集合に対する補集合（A’、B’あるいは全体集合U）という考えが必要であり、全体をもとめる真に対する偽の排他的ソフトウェアが必要になるのです（virtual programming language）。互換性については、問題は何ら発生しません。また、OS(kernel)はモノシリックではmany-coreのシグナルを処理するには限界があるため、自ずとマイクロkernelになるでしょう。また、マイクロkernel自体もプロセス切り替えなどに１つのコアではとても対応できるものではありませんから、kernel自体が２つあるいは３つのコアと連動するsuper micro kernel（仮称）になるでしょう。　ただし、その前に難題が立ちはだかっています。busです。Multiple Instruction Multiple Data stream（MIMD）であるため、道幅を広めてやる必要があります。狭い路地に何万台もの自動車が一気に押し寄せてくるのです。many busをどう構築するか。とにかく、CPUと比べると亀と例えても間違いではないくらいメモリの書き込みに時間が費やされるため、ストレスなくメモりを稼働させるハードウェア技術が求められています。

質問者

お礼 2009/02/11 18:42

うおぉぉぉ！！！こんなにも丁寧な解説ありがとうございます！！とても助かりました。

その他の回答 (1)

和泉博（@hiroshi09s）
ベストアンサー率54% (59/109)

2009/03/28 15:01 回答No.2

Gustafson’s lawが日本ではほとんど知られていないようなので、出題背景を含めて、更に説明を追加しておきます。　確か、32ビットCPUのIntel 80386、30MHz(？)辺りから、CPUに比べてメモリの速度が遅いためCPU側に waitを挿入してメモリとのタイミングをはかっていました。このwaitという空いた時間はCPUは何もしていないため、CPUを有効利用しようということで kernelからは見えない小さなプロセスとして誕生しました（OSに影響を与えない）。90年代半ばには、主流のCPUの使い方となり、2000年以降は我先に見えないthreadから見えるマルチthreadと変貌をとげてきました。　　ところがthreadは、デュアルコアではpdfファイル１ページ（前回答参照のこと）に示したように、１つのタスクで２つのCPU、すなわち全CPUを使っているのです。kernelは、タスクではなくプロセスとして管理し、プロセスを空いた１つのCPUに実行プロセスを割り当てます。また、このkernelの動きはコンピュータ・システム全体として見たとき、至極当然のことであり、最良の手段であると考えられます。しかし、このkernelの１つのCPUを管理という挙動は、threadのΣプロセス＝タスクの挙動とは相容れないものとなっています。この背景から大学の出題となっています。　一方、仮想プログラミング言語では、「kernelがプロセスとして管理している環境下でプログラミングする」という背景から生まれています。したがって、threadのように「OSをどうしよう？」という難題は起きず、根本的にOS自体が大きく変わることはありません。ただ、実行プロセスが簡単に100を超えますから、kernelスケジューラの負担が比例して大きくなります。また、特にsignalを多用するため、瞬時の切り替えが必要になってきます。このとき、早急なスケジューラ反応となるようなkernelの機構改善は避けて通れないということです。　蛇足として、「なぜ、今、データ並列（data parallelism）とタスク並列（task parallelism）なのか？」の説明を加えておきます。その前に、参照URLは「タスクとデータの並列処理」をgoogle.jp検索し、Intel ディレクター James Reinders氏の字幕付きビデオを見て下さい。また、「Gustafson’s law」をgoogle.comで見て下さい。　　あるシミュレーションとして、x,y,z の３次元空間を考えた場合、 ------------------------------------------- for (x = 0; x =< x_max, x++) { 　for (y = 0; y =< y_max, y++) { 　　for (z = 0; z =< z_max, z++) { 　　　式 f(x,y,z); } } } ------------------------------------------- のようなループ構造が考えられます。これを外側のxについてCPU数分分割して、CPUに分担させれば計算を早く済ませることができます。それが計算速度向上の第一段階であるデータ並列です。　ところで、forの中に記された式 f(x,y,z) は、偏微分方程式（長い式となる）が使われます。その計算は参照pdfファイル４ページに示したように Newton-Raphon法のような、１つのデータ群に対して多くの処理が重なるということです。それがタスク並列といわれているものです。　実現済みの外側ループのデータ並列と式f(x,y,z)のタスク並列が実現できれば、理想のコンピュータ計算環境が実現することになり、最速のスーパーコンピュータが出来上がるということになります。そのとき、見てわかるように vector型、scalar型という色分けはありません。

この投稿のマルチメディアは削除されているためご覧いただけません。

メニーコアアーキテクチャ

質問者が選んだベストアンサー

お礼 2009/02/11 18:42

その他の回答 (1)

関連するQ&A

注目のQ&A

カテゴリ
一覧

専門家に質問してみよう
専門家登録

あなたにピッタリな商品が見つかる！ OKWAVEセレクト

メニーコアアーキテクチャ

質問者が選んだベストアンサー

お礼 2009/02/11 18:42

その他の回答 (1)

関連するQ&A

注目のQ&A

カテゴリ 一覧

専門家に質問してみよう 専門家登録

あなたにピッタリな商品が見つかる！ OKWAVEセレクト

カテゴリ
一覧

専門家に質問してみよう
専門家登録