AMR i ASF w GStreamerze
- Dodano: 22 June 2009
- Wprowadził: kocio
- Komentarze: 16
Christian Schaller zapowiada, że już niedługo GStreamer będzie sobie bez zbędnych komplikacji radził z dźwiękiem zakodowanym jako AMR (Adaptive Multi Rate) oraz z kontenerami ASF (Advanced Systems Format).
GStreamer zostanie standardowo wyposażony we wtyczki formatu kodowania głosu AMR NB (Adaptive Multi Rate NarrowBand – koder i dekoder) oraz AMR WB (WideBand – tylko dekoder). Ich kod jest oparty głównie na wtyczkach Opencore wziętych z Androida, dodatkowo połączony z obecnym kodem GStreamera z sekcji “bad” i “ugly”. Odpadnie tym samym konieczność osobnego pobierania z sieci, ponieważ nowe wtyczki są dystrybuowane na wolnej licencji (licencja Apache).
Są także szanse, że jeszcze przed pierwszym wspólnym zlotem środowisk KDE/GNOME uda mu się włączyć do GStreamera obsługę kontenerów multimedialnych ASF (część platformy Windows Media).
Więcej informacji: http://blogs.gnome.org/uraeus/2009/06/12...gstreamer/
Znalazłeś literówkę? Zgłoś ją używając formularza!
Jeśli uważasz, że ten nius jest nieobiektywny, przedstawia nieprawdziwe wydarzenie, jest spamem lub nie spełnia standardów serwisu, napisz raport.
Niusy na podobny temat:
Komentarze są prywatnymi opiniami dodających je osób. Prosimy o zachowanie kultury wypowiedzi. Komentarze obraźliwe oraz obniżające poziom serwisu będą usuwane. Więcej w regulaminie komentowania.
16 komentarzy
Wszystkie autorskie niusy w serwisie publikowane są na licencji Creative Commons Uznanie autorstwa 2.5 Polska.
>> Ich kod jest oparty głównie na wtyczkach Opencore wziętych z Androida, dodatkowo połączony z obecnym kodem GStreamera z sekcji “bad” i “ugly”
Brzmi zachęcająco …
Niestety nie znalazłem opisu problemu mimo przeczytania wpisu w blogu i opisu ticketa. Domyślam się tylko, że ten kod znalazł się tam dlatego, że nie jest samodzielny (tzn. służy do pobierania niewolnych wtyczek czy coś w tym stylu), a nie że sam jest "brzydki" albo niewolny.
Warto spojrzeć tu:
http://en.wikipedia.org/wiki/GStreamer#Plugins
A co z Monkey's Audio (APE)? Odtwarzanie tego pod linuksem to jakaś masakra, nic w sumie tego nie odtwarza albo też ja czegoś nie wiem.
nic czyli np. Audacious występujący chyba w większości dystrybucji ??!!
oo… miło, nie wiedziałem, że on potrafi. fajnie by było, gdyby inne odtwarzacze sobie przyswoiły tę wtyczkę
jest mac, można sobie przekodować do flaca, wtedy jest łatwiej… ale fakt, szkoda trochę, że nic nie wspiera tego formatu…
chyba "moc" Music On Console
MAC.
Monkey's Audio Codec.
W sumie to mało popularny i stosunkowo nowy format, więc co cię dziwi? Zawsze możesz dopisać do jakiegoś silnika obsługę tego formatu.
Mógłbym trochę potestować czy na czymś to działa, ale najpierw musisz dać mi linka do pliku w takim formacie (poniżej 100mb), bo nigdzie nie mogę znaleść.
Mplayer odtwarza od dość dawna.
Może powinienem wspomnieć, dlaczego ten AMR jest taki istotny w ogóle: tak nagrywane są niekiedy ścieżki dźwiękowe na komórkach. Użytkownik Linuksa może nie mieć obsługi egzotycznego formatu XYZ, ale nie móc odtworzyć notatki głosowej, którą sam przed chwilą nagrał, to dosyć frustrujące…
Spotkałem ten format w dyktafonie cyfrowym. Na pierwszy rzut oka miał wsp. kompresji znacznie lepszy niż mp3.
Pewnie dlatego, że jest optymalizowany konkretnie do mowy – podobnie jak Speex jest lepszy w porównaniu z Vorbis, ale niekoniecznie tak samo dobrze radzi sobie z dźwiękami w ogóle, np. z muzyką, bo pewnie obcina od razu zbędne pasmo itp.
Np. na Nokiach standardowo stosuje się AMR-NB 14bajtów/20ms = 700bajtów/s, więc przy takiej kompresji nie ma szans na zapisanie muzyki.
Tak właśnie wtedy uznałem, że jest to jakiś specyficzny kodek do głosu.
Swoją drogą ciekawe jaka jest granica kompresji informacji głosu. Na przykład poprzednie zdanie można w normalnym tempie wypowiedzieć tak około w 5 sekund. Ma 68 bajtów, do tego trzeba byłoby dodać informacje o częstotliwości intonacji zdania, załóżmy, że dodatkowe 2 bajty na wypowiedzianą literę. Dałoby to łącznie 204 bajtów / 5 sekund czyli około 40 bajtów/s
Można jeszcze sprytniej – jeśli kawałek jest dłuższy, to można zbudować jakiś profil głosu i zakodować ten profil plus zwykły tekst. =}