PODPOWIEDZI:

Co Amazon robi w Polsce? Relacjonujemy Innovation at Amazon

Co Amazon robi w Polsce? Relacjonujemy Innovation at Amazon

Innovation @ Amazon to jedyna taka konferencja, na której technologiczny gigant prezentuje wizje nie tylko gotowych produktów, ale i rozwiązań informatycznych, które je zasilają. Sprawdziliśmy, co Amazon robi w Polsce i czy jest szansa na polskiego asystenta głosowego?

Jeśli zastanawialiście się, czym jest nauczanie maszynowe, czy roboty mogą być inteligentniejsze od ludzi oraz co może zrobić asystent głosowy Alexa, to dobrze trafiliście. Stary Maneż gościł ekspertów ze świata IT, którzy prezentowali odpowiedzi na pytanie: Jaka jest przyszłość sztucznej inteligencji?

Amazon działa w polsce?

Zdecydowanie tak. I choć firma utożsamiana jest głównie ze sklepem internetowym, a w naszym kraju z centrami logistycznymi, to w naszym kraju dzieje się znacznie więcej. Wszystko to dzięki Amazon Development Center w Gdańsku.

Amazon-development-centre-gdansk

Powstało ono na fundamentach innego dużego projektu - syntezatora mowy Ivona. Być może część z was kojarzy filmiki z Gothica albo ściągane na szybko z internetu filmy, których lektorem był nietypowy, męski głos. To właśnie w Gdańsku powstawała technologia, która stała się filarem systemu text to speech. Oczywiście, poza tym w sercu Trójmiasta rozwijane są też technologie z zakresu Natural Language Understanding, Data-Pipeline oraz sama Alexa. 

Dużo kompleksowych rozwiązań

Brzmi skomplikowanie, prawda? Amazon ma wiele oddziałów na całym świecie, w których pracują ludzie zajmujący się technologiami z zakresu IT. My, jako końcowi użytkownicy stykamy się z nimi w zjadliwej, ludzko brzmiącej formie. Jednak aby systemy działały globalnie i działały sprawnie, potrzeba koordynacji działań licznych zespołów. Część z nich miała okazję zaprezentować swoje działania podczas konferencji Innovation at Amazon w Gdańsku.

Chmura napędzająca maszyny

Żeby asystent taki jak Alexa w głośniku Echo mógł zadziałać, musi zajść wiele procesów. Często muszą one się rozegrać w ułamku sekundy - tak naprawdę dopiero wtedy możemy powiedzieć, że urządzenie jest inteligentne. Aby nie pakować do każdego urządzenia mocarnych podzespołów, część procesów odbywa się w chmurze.

Amazon-echo 

Dzięki algorytmom, które najpierw konwertują usłyszaną frazę na tekst, a potem wysyłają ten tekst do chmury obliczeniowej, proces trwa ułamki sekund. Za wszystko odpowiedzialne jest Natural Language Understanding (NLU). Rozwiązanie to pozwala urządzeniu na rozumienie kontekstu wypowiedzi w taki sposób, by odbyło się to naturalnie. Kiedy poprosimy Alexę: 

  • Pokaż mi najbliższy zamek. 

Głośnik Amazona będzie wiedział, że nie chcemy zobaczyć naszej bluzy, a lokalną atrakcję turystyczną. Poprzez przetwarzanie milionów godzin rozmów asystent uczy się akcentów i sposobów wypowiadania i brzmienia danych wyrazów. To wszystko dzieje się w chmurze, nie zaś za pośrednictwem samego urządzenia (małe głośniki jak Echo Dot mogłyby się w końcu przemęczyć). W rezultacie jest on w stanie wyłapać niuanse językowe, a nawet wywnioskować dalszy kontekst, jeśli zabraknie części zdania. To zdolna maszyna.

Co to znaczy, że Alexa ma skilla?

Można by więc powiedzieć, nie tłumacząc zbytnio na język polski, że Alexa ma skilla. I rzeczywiście ma. Całe kilkadziesiąt tysięcy. Za to, jaką akcję podejmie urządzenie, odpowiadają Alexa Skills. To funkcja przede wszystkich dla zewnętrznych deweloperów. Dzięki prostemu oprogramowaniu mogą oni skorzystać z możliwości Alexy w swoich aplikacjach. To dzięki skillom możesz zamówić taksówkę bez wyjmowania telefonu. Schemat jest bajecznie prosty: wydajesz asystentowi dyspozycję, np. Zamów mi taksówkęa wszystko to dzieje się w chmurze. Otrzymujesz tylko głosowe potwierdzenie. 

W tym momencie, jeśli korzystacie z aplikacji mobilnych możecie odnieść wrażenie, że to podobny schemat. Jak jednak tłumaczy David Kaiser odpowiedzialny za rozwój tej technologii, jest kilka różnic:

Polega to na tym, że aktywujesz skill i działa on w chmurze, a nie na urządzeniu - tym różni się to od aplikacji mobilnych. Jeśli więc wezwiesz Alexę, by zamówiła Ubera, to dzieje się najczęściej w tle zaraz po aktywowaniu. Oczywiście, gdy używasz Ubera, jest on podpięty pod twoje konto w aplikacji - robisz to jednorazowo na telefonie i potem możesz z tego bezproblemowo korzystać.

A każdy skill ulepsza asystenta Amazonu. Bowiem to właśnie skille napędzają wszystkie mechanizmy nauczania maszynowego. 

Maszyny też mogą się uczyć

W nauczaniu maszynowym nie chodzi o bezpośrednie uczenie maszyn, a o to, by same się uczyły. Oczywiście potrzebują do tego dużo danych. Dostęp do chmury Amazonu pozwala na przyswajanie dużej ilości danych. Alex Klementiev odpowiedzialny za zespół zajmujący się tym zagadnieniem, tłumaczy cały proces: 

 Nauczanie maszynowe celuje w odkrycie schematu w danych, który pozwoli dostrzec przewidywania dotychczas niezaobserwowane. Jednym z przykładów jest tłumaczenie maszynowe, gdzie patrzysz na tłumaczenia wygenerowane przez ludzi, a celem jest przetłumaczenie zdań, które nie pojawiły się w bazach danych. [...] W tłumaczeniu maszynowym, jeśli chcesz przetłumaczyć dużo tekstu, którego wcześniej nie widziałeś, z jednego języka na drugi, jest bardzo trudno dokonać tego ręcznie. Wymaga to profesjonalnych tłumaczy z obydwu języków.

machine-translation

Największym problemem uczeniem maszynowego jest problem w łączeniach między danymi. Tak jak my na słowo jabłko mamy w głowie gotowy obraz, tak w przypadku maszyn system skojarzeń nie jest idealny. Jak zapewnia Alex Klementiev, w Amazonie robią wszystko, aby nauka urządzeń była jak najbardziej intuicyjna. Muszą się one bowiem zbliżyć do inteligencji nie tylko przez sam przemiał danych, ale i przez sposób, w jaki to zrobią. Na ten moment nasza ludzka inteligencja jest unikalna i jesteśmy niezagrożeni. Niemniej, maszyny szybko się uczą. Kto wie, może niebawem zastąpią mnie przy VideoNewsie - podsumowaniu tygodnia?

Czy Alexa Nauczy się polskiego?

Więc skoro Alexa tak szybko się uczy, to czy możemy się spodziewać, że nauczy się też polskiego? Nie mamy jednoznacznej odpowiedzi. Rafał Kukliński, szef Amazon Development Centre w Gdańsku, tak tłumaczy obecną fazę rozwoju Alexy: 

Pracujemy nad internacjonalizacją Alexy [...] by udostępnić ją wszędzie tam, gdzie jest Amazon.

[...] to jest skomplikowany proces, każdy język ma swoje własne zawiłości, swoje własne specyficzne elementy. Oczywiście nabieramy wprawy, jesteśmy w tym coraz lepsi, budujemy automatyzację wokół tej technologii - natomiast jest to cały czas early days dla systemów głosowych.

Tak czy inaczej, ku stworzeniu takiej opcji jest dużo narzędzi, ale i dużo zawiłości. Szczególnie język polski może być problematyczny już na poziomie przetwarzania mowy. Ale 5 lat temu nikt nie pomyślałby, że zwykłą komendą głosową można będzie kontrolować cały dom, a teraz jest to niemalże naturalne. 


Podziękowania dla Amazon Development Center w Gdańsku za współpracę przy tworzeniu materiału.

blog comments powered by Disqus
Co Amazon robi w Polsce? Relacjonujemy Innovation at Amazon