Spóźniony, 16-rdzeniowy procesor Opteron 6200 od AMD

AMD zaprezentowało pierwszy na świecie 16-rdzeniowy procesor w architekturze x86. Większa przepustowość i wydajność, przy mniejszym zużyciu energii to tylko część jego zalet. Cena Opterona nowej generacji waha się pomiędzy 1600 zł a 3300 zł.

16-sto rdzeniowy Opteron 6200 gwarantuje do 35% większą przepustowość niż procesory poprzedniej generacji. Opteron zaprojektowany został w celu zwiększenia skalowalności zastosowań komercyjnych (obsługa baz danych, chmury obliczeniowe, HPC czyli high-performance computing).

Architektura Bulldozer pozwala na wykonywanie większej ilości operacji w pojedynczym cyklu zegarowym, przy jednocześnie mniejszym poborze mocy. Procesor pobiera od 5 do 8 Watów na rdzeń. Jest on kompatybilny z systemem Linux i Windows server 2008. Wiadomo już, że Opteron 6200 wykorzystany zostanie w serwerach producentów: HP, Dell, Cray i Acer.

Opteron 6200 zadebiutował wcześniej niż Xeon E5 Intela. Może to pomóc AMD w odbudowaniu słabnącej pozycji. W drugim kwartale tego roku AMD obsługiwało jedynie 5,5% procent rynku. Reszta była w rękach Intela. AMD zmagał się dodatkowo z wieloma problemami i licznymi skargami ze strony klientów. Wszystko to przyczyniło się do opóźnienia premiery Opterona 6200. Jednakże żadne niesnaski nie umniejszają tego, co wnosi 16-sto rdzeniowy procesor. Na jego podstawie budowany jest superkomputer, który ma prześcignąć najszybszą na świecie japońską konstrukcję Fujitsu – superkomputer K.

żadnych reklam, sama wiedza.

Zarejestruj się na BEZPŁATNY NEWSLETTER i raz w tygodniu otrzymuj najważniejsze wiadmości
ze świata IT, nowych technologii i kryptowalut.

Bez reklam.

17 odpowiedzi na „Spóźniony, 16-rdzeniowy procesor Opteron 6200 od AMD”
  1. Awatar yoda
    yoda

    To się chyba odmienia "Opterona" (a nie "Opteronu") i chyba nie koszt a cena (może się i czepiam ale to zdanie brzmi tragicznie w obecnej formie)

    Co do operacji na cykl to chyba chodziło o sumaryczną ilość operacji zdolnych do przetworzenia (więcej rdzeni/modułów) bo sam współczynnik IPC dla Buldożera jest mniejszy niż w dla K10.x

    PS 16 rdzeni w tym przypadku oznacza 8 modułów

    1. Awatar jellonek
      jellonek

      poprawilem.

      ps. o jakich modulach piszesz?
      ilosc operacji na cykl to nie ytlko ilosc rdzeni, ale tez zwroc uwage na to ze kazdy z rdzeni ma kilka jednostek wykonawczych w tym rowniez roznych typow, dzieki czemu w tym samym rdzeniu (jednym z 16tu) masz mozliwosc wykonywania kilku instrukcji jednoczesnie.

      1. Awatar jarek
        jarek

        Ilosc rdzeni, ALU czy co tam jeszcze tez o niczym nie przesadza. Dlatego 4-ro rdzeniowy i7-2600K
        leje dupe 12-to rdzeniowemu Opteronowi 6100, w wydajnosci, w cenie i w poborze mocy.

        1. Awatar jellonek
          jellonek

          nie wiem skad masz te informacje, ale mam tu u siebie maszynik 48core amd i 16 core inteli i choc faktycznie intel w niektorych (bardzo specyficznych) zadaniach moze okazac sie szybszy – to jednak ogolnie przegrywa.
          z podobnej przyczyny mocno okrojone cory kart graficznych, mimo ze dzialaja przy jakichs 600-800 MHz przy przetwarzaniu strumieniowym spokojnie rozklada i 48core amd, jak i wszelkie intele, bo tych "wolnych core" ma > pol tysiaca…

          1. Awatar jarek
            jarek

            "nie wiem skad masz te informacje, ale mam tu u siebie maszynik 48core amd i 16 core inteli i choc faktycznie intel w niektorych (bardzo specyficznych) zadaniach moze okazac sie szybszy – to jednak ogolnie przegrywa. "

            Wiadomo, modeli i7 i Opteronow jest sporo, podalem konkretne.
            Ale jak chcesz powiedziec, ze 16 rdzeni Intela potrafi pokonac 48 rdzeni AMD,
            to sie zgadzam. Niestety, srednio to swiadczy o AMD.

            "z podobnej przyczyny mocno okrojone cory kart graficznych, mimo ze dzialaja przy jakichs 600-800 MHz przy przetwarzaniu strumieniowym spokojnie rozklada i 48core amd, jak i wszelkie intele, bo tych "wolnych core" ma > pol tysiaca… "

            Jest tez druga strona medalu. Na szybkim rdzeniu jeden watek wykona
            sie szybko i zadna ilosc wielu wolnych rdzeni tego nie zastapi.

          2. Awatar jellonek
            jellonek

            to raczej swiadczy o kiepskim kodzie, ktory nie umie sie rozkladac dowolnie na dostepnych corach.

            inna sprawa to ilosc cache.

            wlasnie diagnozuje sytuacje w ktorej xeony, 4core 2GHz z 4M cache per core bija w pewnym zastosowaniu o 50% 48core amd @2.2GHz – z tym ze tu jest juz tylko 0.5M per core 😉

            co do tej drugiej strony medalu – tak jak wyzej napisalem – wszystko zalezy od zadania, postawionego przed danym procem…

          3. Awatar Budyń
            Budyń

            @jellonek

            Bo nie powinien się rozkładać. O tym powinien decydować OS.
            I dlatego czekam na OSy i oprogramowanie w całości z kodem zarządzanym – tak, aby oprogramowanie mogło zgłosić OSowi manifest pt. "mam n potencjalnie równoległych zadań z tych te wymagają klasy "real time" (np. GUI), z tych normalnego priorytetu, z tych "best effort") a kiedy to już się stanie, żeby VM i garbage collector adekwatnie obsługiwały wskazane fragmenty kodu.

          4. Awatar Budyń
            Budyń

            acha – i nie każde zadanie da się tak zrównoleglić.

          5. Awatar jellonek
            jellonek

            a to ciekawe jak os ma ci rozlozyc zadanie, ktore do kolejnych obliczen wymaga wynikow z poprzedniej iteracji…

            troszeczke chyba nie wiesz o czym piszesz…

        2. Awatar Artur
          Artur

          "4-ro rdzeniowy i7-2600K leje dupe 12-to rdzeniowemu Opteronowi 6100, w wydajnosci, w cenie i w poborze mocy."
          Co do ceny to można się zgodzić (inna sprawa, że to śmieszne porównywać procesor desktopowy z procesorem pracującym w maszynach 4 procesorowych). Co do poboru mocy, to akurat jeżeli weźmiemy na tapetę Opterona 6168 (12-core, 1,9GHz) i jego 80W (ACP), to jest to mniej więcej ten sam przedział co 95W TDP Intela i7-2600K.
          Natomiast przy wydajności, musiałbyś nieco bardziej sprecyzować pod jakim względem intel jest lepszy? Jeden rdzeń? Faktycznie jest szybszy, w końcu ma 3,4GHz, a w porywach nawet 3,8GHz. Ale operacje na wielu rdzeniach na raz? Testy SPEC CFP2006 Rate wyraźnie pokazują, że Intel nie ma tutaj startu do jednego procesora AMD. Jeżeli bierze się pod uwagę moc obliczeniową klastra oraz jego całkowity pobór energii (tak, przy klastrach pobór mocy jest istotny i często ograniczony przez warunki zewnętrzne), okazuje się, że zarówno maszyny oparte o procesory Intela, jak i te oparte o procesory AMD mogą się pochwalić bardzo zbliżonymi wynikami wydajności na wat.

      2. Awatar yoda
        yoda

        Buldożer ma niestandardową budowę "rdzenia" i np. jednostek stałoprzecinkowych jest 16 ale zmiennoprzecinkowych już tylko 8, w tym przypadku 16 "rdzeniowy" składa się tak naprawdę z 8 "modułów" – gdzie współdzielony jest m.in. cache L2 i jednostka zmiennoprzecinkowa, po dalsze szczegółu odsyłam do recenzji i testów

        co do instrukcji na cykl to amd podaje zapewne wzrost sumaryczny dla całego procesora, dla jednego wątku IPC buldożera jest trochę mniejsze od IPC dla jednego wątku w k10.x

        1. Awatar jellonek
          jellonek

          nie kojarze takich wartosci dla "procesora", kojarze tylko per core.
          inaczej piszac – ma 16 core staloprzecinkowych + 8 zmienno przecinkowych?
          gdzie te czasy gdy koproc zmienno przecinkowy byl osobnym ukladem? 🙂

          1. Awatar yoda
            yoda

            Per core w przypadku buldożera jest kłopotliwym określeniem.
            Popatrz np na to (schemat 8modułowca): http://images.anandtech.com/doci/4955/BDArch.png

          2. Awatar jellonek
            jellonek

            a czy rozumiesz ten rysunek?
            wspoldzielony miedzy fmac jest scheduler, ale ze operacje fp sa znacznie wolniejsze niz integer – w wiekszosci przypadkow wspoldzielony scheduler spokojnie rozdzieli na 2 fmace zadania.
            dzieki temu ze jest wspoldzielony – masz mozliwe operacje AVX 256bit, co prawda nie uzywane w starszym sofcie, ale mogace dodac kolejnego "kopa" wydajnosci w nowych appach.

            to – co wydawalo ci sie problemem i degradacja ilosci core (tj. ze na 2 jednostki integer przypada 1 fp – to nie prawda, bo dalej to 2 na 2 jest) – tak na prawde jest atutem.

            raz jeszcze przypomne – operacje fp nie wykonuja sie w jednym cyklu, nie potrzebuja osobnych napedzajacych je schedulerow…

  2. Awatar _kj_
    _kj_

    "16-sto rdzeniowy Opteron 6200 gwarantuje do 35% większą przepustowość niż procesory poprzedniej generacji."

    Przepustowości czego? Pamięci? Pamiętam tekst inżynierów z IBM nt. procesorów Power. Leciał on jakoś tak:
    "potrafimy bez trudu stworzyć mikroprocesor zdolny do wykonania w jednym cyklu zegarowym do 4 operacji zmiennoprzecinkowych. Problemem jest tylko to, że do pobrania danych do tych operacji potrzeba 100 cykli zegarowych".

  3. Awatar anemus
    anemus

    E tam 16-to rdzeniowy. Architektura buldożerów więc 8-mio rdzeniowy z ichniejszym odpowiednikiem HT – jeden dekoder instrukcji wspólny cache kolejka i jednostki około wykonawcze (predykcji skoków itd) oraz jeden blok FPU mogący tylko pracować w trybie "wirtualnych" dwu jednostek 128 bitowych lub jednej normalnej 256 bitowej. Jedyna oznaka "dwóch rdzeni" na moduł czyli dwa klastry ALU to jednak sporo za mało by określić moduł jako dwa pełnoprawne rdzenie. Zresztą testy wydajnościowe to potwierdzają.
    czyli tak naprawdę takim jak Opteron 6200 powinien być od początku topowy "ośmiordzeniowy" FX, a topowy Opteron powinien mieć dwa razy tyle bloków (tu 16 czyli ichniejsze 32 "rdzenie") bądź zintegrowany koprocesor strumieniowy na bazie profesjonalnych odpowiedników radków (Firestream)

  4. Awatar Budyń
    Budyń

    A cicho pochowany SUN Microsystems miał UltraSPARCa T2 od 2007 roku – 8 rdzeni x 8 wątków na rdzeń i konfiguracje kilkuprocesorowe. T3 miał oferować 8×16 czy nawet 16×16…. Rock obsługiwać sprzętowo pamięć transakcyjną…..
    Była też Tilera….

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *