Deep fake audio: Załadować próbkę głosu – i nim mówić..

Deep fake audio jest już w zasięgu ręki każdego. Uruchomili serwis, gdzie można załadować próbkę głosu i generować dowolną wypowiedzianą nim frazę

31 stycznia 2023, deep-fake-audio-juz-w-zasiegu-reki

Oczywiście wymagane jest odznaczenie potwierdzenia, że mamy prawo do używania danego głosu, ale część osób niezbyt się przejmuje tego typu checkboxami. Engadget donosi np. o przypadkach klonowania głosów celebrytów, którzy następnie „wypowiadali” rozmaite kompromitujące frazy.

Inny przykład niedobrego zastosowania tej technologii to zaawansowany vishing – tego typu jak np. ten.

Regularni czytelnicy sekuraka pamiętają pewnie niedawnego newsa o podobnym projekcie Microsoftu, gdzie do sklonowania głosu wystarczyło raptem parę sekund nagrania (ale nie udostępniono prostego interfejsu umożliwiającego upload dowolnego głosu). Microsoft zastrzega:

Since VALL-E could synthesize speech that maintains speaker identity, it may carry potential risks in misuse of the model, such as spoofing voice identification or impersonating a specific speaker. We conducted the experiments under the assumption that the user agree to be the target speaker in speech synthesis. If the model is generalized to unseen speakers in the real world, it should include a protocol to ensure that the speaker approves the use of their voice and a synthesized speech detection model.

Dla Polaków jest też dobra informacja – zobaczcie dopisek na pierwszym zrzucie: „currently works best on US-English accent”.

Postępy cyber-bandytyzmu: Sklonowali głos prezesa (deep fake). A pracownicy zlecili przelewy.

Sklonowali głos prezesa (deep fake). I przekonali pracowników żeby zlecili przelewy na równowartość przeszło 100 milionów PLN

21 października 2021, –Michał Sajdak sklonowali-glos-prezesa-i-przekonali-pracownikow-ci-zlecili-przelewy

Temat opisuje Forbes, wskazując również na dokumenty sądowe dostępne tutaj. Co się wydarzyło? Wg relacji najpierw próbka głosu prezesa została nagrana (może np. jakaś prelekcja na konferencji) a następnie przetworzona.

Po przetworzeniu atakujący mogą już wymawiać głosem prezesa dowolne zdanie.

Jeśli chcecie przetestować tego typu technologię, to zobaczcie ten przykład: tacotron

Wracając do opisywanego oszustwa zacytujmy obszerny fragment z Forbesa:

In early 2020, a bank manager in the United Arab Emirates received a call from a man whose voice he recognized—a director at a company with whom he’d spoken before. The director had good news: His company was about to make an acquisition, so he needed the bank to authorize some transfers to the tune of $35 million. A lawyer named Martin Zelner had been hired to coordinate the procedures and the bank manager could see in his inbox emails from the director and Zelner, confirming what money needed to move where. The bank manager, believing everything appeared legitimate, began making the transfers.

Emiraty Arabskie twierdzą, że w akcji została użyta właśnie technologia klonowania głosu (czytamy o tym w dokumentach sądowych, które dotyczą dwóch z siedemnastu oskarżonych).

Jeśli interesują Cię tego typu ciekawostki, zapraszamy na nasze modułowe szkolenie cyberawareness.

Swoja drogą jakiś czas temu opisywaliśmy podobną sprawę, gdzie na celowniku była firma brytyjska:

the CEO of an unnamed UK-based energy firm believed he was on the phone with his boss, the chief executive of firm’s the German parent company, when he followed the orders to immediately transfer €220,000 (approx. $243,000) to the bank account of a Hungarian supplier. (…) Mr. Kirsch believes hackers used commercial voice-generating software to carry out the attack. He recorded his own voice using one such product and said the reproduced version sounded real.

No więc – idzie nowe? A może już dawno przyszło, tylko nikt specjalnie nie chce się chwalić swoimi dużymi wpadkami?

============================

Por.: Dwa groźne wypadki – i wnioski z nich wynikające.

Dwa groźne wypadki – i wnioski z nich wynikające.

Dwa groźne wypadki – i wnioski z nich wynikające.

Mirosław Dakowski. 21 kwiecień 2023

Dwa lata temu znajoma otrzymała w nocy telefon od córki z Kanady. Córka roztrzęsionym głosem mówiła: Mamo, stało się nieszczęście. Wypadła mi pod samochód kobieta, nagle, nie zdążyłam zahamować i ją zabiłam. Nie wiem co robić!! …Na szczęście w patrolu policji który przyjechał, znalazła się oficer-Polka. Zaproponowała mi, że sprawę da się załagodzić, ale potrzeba 15 000 dolarów.

Matka pyta: Kochanie jak mogę ci pomóc?

Córka: Ona mówi że ma ojca w polskiej policji, jest oficerem w Warszawie. To on mógłby wpaść po te pieniądze, i już wszystko będzie chyba załagodzone.

Roztrzęsiona starsza pani zadzwoniła do swego syna, który na szczęście był bardziej krytyczny. Zadzwonił natychmiast do Kanady na ten posterunek, o którym mówiła jego „siostra”, i dowiedział się, że o żadnym wypadku nic nie wiedzą. Próbował zorganizować pułapkę na tego „oficera policji”, który miał przyjść po pieniądze. Ale „dzielny oficer” widocznie się zorientował, bo nie oddzwonił. Zawiadomiono policję, śledczych, no i śledztwo” trwa” – już dwa lata.

Drugi:

Córka znajomej jest osobą znaną w świecie medialnym. Przedwczoraj roztrzęsiona zadzwoniła do mamy, mówiąc: Mamo ja przed chwilą zabiłam kobietę!! Wpadła mi nagle na maskę!! A mówię tak niewyraźnie, bo mam złamany nos. Na szczęście dzieci [tu wymieniła ich imiona] są w domu, pod opieką Lesi [która naprawdę u niej pracuje]. Panowie oficerowie mówią, że sprawę da się załagodzić, ale potrzebne jakieś 45 000. Przecież masz, załóż, ja ci za parę dni oddam. Ale to chodzi o czas…

Dopiero w tym momencie znajoma zaczęła podejrzewać, o co tamtej chodzi. Powiedziała: „Dobrze córeczko, oddzwonię ci, gdy tylko zdobędę pieniądze, część wyciągnę z szafy, pożyczę od sąsiada

Mamo, ale ja dzwonię z telefonu pana oficera, jest to telefon zastrzeżony. To on wpadnie do ciebie za 20 minut dobrze?”

– Doskonale a ja tymczasem zadzwonię i dowiem się jak tam dzieci – powiedziała mama.

No i tu sprawa się rypła. Ani „córka “, ani oficer się nie pojawili. Natomiast prawdziwa córka, siedząca spokojnie w domu, się wściekła i chciała zawiadomić prawdziwą policję.

Czy to coś da, nie wiemy. Ja przed paru tygodniami dostałem pismo z Komendy Policji, że moje zgłoszenie [naprawdę groźnego przestępstwa – KLĄTWA w teatrze Powszechnym] sprzed trzech lat… właśnie zostało umorzone. Z braku czegoś tam. Podpisy, pieczęcie.

==============

W związku z tym poszperałem trochę, by się dowiedzieć, jak działają programy imitujące głosy. Takie programy były już użyte w czasie przedstawienia on line, zwanego „World Trade Center 9/11” w 2001 roku, gdzie jeden z porwanych pasażerów zadzwonił z samolotu do mamusi, i przedstawiał się jej dwukrotnie z imienia i nazwiska. Tam zszokowana matka tego drobiazgu nie zauważyła.

Ale przez te 22 lata postęp w informatyce, w tak zwanej „sztucznej inteligencji” jest ogromny. Już dwa lata temu można było za niewielkie pieniądze kupić program, który głos dowolnej osoby, na przykład jakiejś aktoreczki ubiera w barwę głosu wybranej osoby. Wystarczy nagrać parę wystąpień w telewizji, oraz parę rozmów telefonicznych przyszłej ofiary, trochę poćwiczyć, by ta aktoreczka miała nie tylko barwę głosu przyszłej ofiary, ale również używała jej standardowych powiedzeń.

Bierzmy to pod uwagę, gdy zadzwoni do nas ktoś najbliższy, którego rozpoznamy po głosie, i rozdygotanym głosem coś nam zacznie mówić.

Pamiętajmy, że te grupy bandyckie są bezczelne i sprytne, ale jednak mało twórcze, niezbyt inteligentne.