만일 좀더 깊은 답변을 원한다면, "긴 답변들"부분을 참조하기 바란다.
Beowulf라하는 것은 고성능의 많은 병렬컴퓨터를 상용화된 하드웨어와 리눅스와 FreeBSD와 같은 free software를 이용하여 빠른 사설 네트워크를 이용해서 연결해 놓은 것이다. 이는 PC나 워크스테이션들의 묶음으로 되어 있는데 주로 고성능 계산에 주로 이용된다. 클러스터에 있는 노드들은 사람들이 주로 사용하는 책상위에 있지 않다. 외부세계와의 연결은 서버인 노드만이 할 수 있도록 되어있다. 몇몇 리눅스 클러스터들은 속도보다는 안정성에 기반을 두고 만들어졌다. 이것들은 Beowulf라고 할 수 없다.
Beowulf라고 불리는 소프트웨어 패키지는 없다. 단지 Beowulf를 제작하기 위해 많은 사람들이 만들어 놓은 몇몇가지 소프트웨어가 있다. 그 소프트웨어는 MPICH (역자주: MPI(Message Passing Interface)의 일종으로 MPI Chameleon의 약자)와 LAM(역자주: MPICH와 같이 MPI의 일종으로 Local Area Multicomputer의 약자), PVM(역자주: Private Virtual Machine으로 MPI와는 달리 주로 이기종간의 컴퓨터 연결에 이용됨), 리눅스 커널, 리눅스 커널의 채널본딩 패치(이는 여러분이 빠른 "버츄얼" 이더넷 인터페이스에 다중의 이더넷 인터페이스를 연결시켜준다.)과 리눅스 커널에 global pid space 패치(이는 Beowulf에서 돌아가는 모든 프로세스를 ps나 kill등의 명령으로 제어할 수 있게 해줌), DIPC(이는 sysv 공유 메모리, 세마포어와 메세지큐를 투명하게 사용할 수 있게 해줌)
될 것입니다. MPI나 PVM, 네트워크 소켓 또는 Sysc IPC를 이용해서 통신할 수 있는 병렬작업으로 본래의 작업을 분리하는 일이 필요할 것입니다. 그런후 다시 컴파일을 해야합니다.
또는 Greg Lindahl이 지적했듯이 만일 여러분이 다른 입력 파일을 가지고 수천번의 동일한 프로그램을 실행하고 싶다면 쉘스크립트를 이용하면 충분할 것입니다.
Christopher Bohn이 지적한 것처럼 multi-thread 소프트웨어도 자동적으로 속도향상을 꾀할 수 없다. multi-threaded 소프트웨어는 공유메모리를 가정한다. 몇몇 배포된 공유메모리 패키지가 개발중이다. (DIPC, Mosix, ...), 하지만 SMP 머신을 위해 만들어진 소프트웨어 내부에 있는 메모리 접근 형태는 궁극적으로 DSM 머신의 성능저하를 가져온다.
PVM과 MPI는 클러스터에서 포트란이나 C를 이용해서 작동하도록 만든 message-passing 병렬 프로그램이다. PVM은 MPI가 나오기 전까지 사실상의 표준이었다. 하지만 아직도 많이 이용되며 성능면에서 좋다.MPI (Message Passing Interface)는 portable message-passing 병렬 프로그램에 사용되는 표준이다. MPI는 MPI Forum을 통해서 표준화가 되었고 모든 대용량의 수퍼 컴퓨터들에 사용되고 있다. (역자주: 보통 PVM은 이기종간의 병렬처리에 이용되고 MPI는 동종간의 처리에 많이 이용된다.) 더 많은 정보를 얻으려면 PVM과 MPI FAQ에서 내용을 참조할 수 있다.
없습니다. plogic.com에서 나온 BERT라는 프로그램이 있는데 이는 여러분의 포트란 코드를 여러분이 수동으로 변경해야합니다. NAG와 Portland 그룹의 포트란 컴파일러는 여러분의 포트란 코드를 병렬처리에 알맞게 변경해줄 수는 있는데 힌트가 주어져야합니다. (HPF와 OpenMP 디렉티브의 형태로) 이러한 버젼들은 비병렬버젼들보다 속도가 전혀 빠르지 않습니다.
Beowulf가 좋다고 생각하거나 전형적인 수퍼컴퓨터 가격에 1/3에서 1/10 가격으로 거의 동일한 성능을 보이기 때문이라 생각해서 입니다.
없습니다. Oracle과 Infomix가 이러한 기능을 갖게 될지 모르지만 리눅스에서는 아직 그런 기능은 하지 않습니다.
대부분의 사람들은 그렇지 않습니다. 왜냐하면 별로 필요하지 않기 때문입니다. 그들이 리눅스를 구동시킨다면 대부분이 telnet을 이용하여 접속할 것입니다. 많은 Beowulf들이 모든 노드에 비디오 카드를 갖고 있지 않습니다. 콘솔 접속은 일반적으로 부팅할 수 없을 때 필요로 합니다.
몇몇 사람들은 이대신 시리얼 포트를 사용합니다.
누가 bozo인지 본저자는 모르겠습니다. 아마 본저자일지도 모르겠습니다. Don Becker, Walter B. Ligon, Putchong Uthayopas, Chrisopher Bohn, Greg Lindahl, Doug Eadline, Eugene Leitl, Gerry Creager, William Rankin이 일반적으로 그런 사람으로 알려져 있으며 도움을 기꺼이 주는 분들이다. 이 카테고리에 다른 사람도 들어있다.
Robert G. Brown은 bozo라고 선언했지만 본저자는 그렇게 믿지 않으며 심지어 그가 본저자에게 광대얼굴을 보여줬음에도 불구하고 그렇게 생각하지 않는다. Rob Nelson 또는 bozo라고 자신을 여기지만 그 또한 실수를 하고 있는 듯하다.
없습니다. PentiumGCC가 이에대한 지원을 하고 있습니다.
한개의 Celeron 333 머신보다 느릴 것이지만 좋은 배움의 기회가 될 것입니다.
그렇지 않습니다. 원래 Beowulf는 슬랙웨어에서 구동되어 있습니다.
사용하지 마세요. 오래된 것입니다.
필요없습니다. 만일 libc5기반의 Beowulf에 특별한 응용프로그램을 깔고자 한다면 libc5가 있어야 합니다. 마찬가지로 glibc기반의 Beowulf에서 특별한 응용프로그램을 깔려면 glibc로 컴파일이 잘되고 실행이 잘되는지 확인하시기 바랍니다.
소프트웨어를 설정할 때 각노드들에 대하여 설정을 달리 하지 않을 것을 권합니다. 그렇게 되는 경우는 머리아픈 문제를 만들어 낼 수 있습니다.
gcc부류, Portland Group, KAI, Fujitsu, Absoft, PentiumGCC, NAG 등이 있습니다. 컴팩은 우수하다고 알려진 베타 알파리눅스 컴파일러를 사용할 것이며 몇몇 사람들은 Digital Unix에서 그들의 응용프로그램들을 이미 컴파일 했으며 알파리눅스에서 작동시킨다.
여러분이 응용을 어떻게 하느냐에 달려 있습니다. 벤치마킹 해보고 기록하고 병목현상이 있는지 찾아내고 고치고 반복하면 된다. 몇몇 사람들은 dual-CPU 머신들이 single-CPU보다 성능면에서 앞선다고 하는데 이유는 여러분의 계산이 다른 CPU가 모든 네트워크 인터럽트를 다루는 동안 인터럽트 될 수 있기 때문이다.
물론입니다. 여러분의 응용프로그램을 잘 분리하면 훨씬 수월해질 것입니다.
이 FAQ의 "긴 답변들"을 참고 하면 된다. http://beowulf.org http://beowulf-underground.org/ http://beowulf.gsfc.nasa.gov http://www.extremelinux.org http://www.xtrem-machines.com/x-links.html <beowulf@beowulf.gsfc.nasa.gov> 메일링 리스트를 이용하면 된다. 또한 FAQ의 "보충 정보와 자료 (Supplementary information and resources)" 섹션을 참조하면 된다.
http://www.xtreme-machines.com/x-cluster-qs.html를 살펴보면 방법을 숙지 할 수 있습니다. 또한 이곳 FAQ의 "보충 정보와 자료 (Supplementary information and resources)"의 내용중 "Docs"부분에서 docs를 살펴보면 알 수 있습니다.