En ocasions, escolto veus - podcast episode cover

En ocasions, escolto veus

Apr 14, 202543 minEp. 175
--:--
--:--
Download Metacast podcast app
Listen to this episode in Metacast mobile app
Don't just listen to podcasts. Learn from them with transcripts, summaries, and chapters for every episode. Skim, search, and bookmark insights. Learn more

Episode description

Sembla que estem tornant a una cultura més oral. Per això explorem com la veu està guanyant terreny a l’escriptura en la interacció amb la IA. I de pas, t’expliquem com aprofitar-ho per treballar millor i, si pots, una mica menys.

Notes de l’episodi:

Els nostres mecenes:

Enllaços:

Transcript

Jo sempre dic que crearé una drecera per crear un quicktime audio i no ho faig mai. Seria bona, és veritat. Mira, jo estic començant a fer servir els shortcuts d 'iOS i no està mal, no està mal. Per exemple, hi ha la típica nota de veu que abans gravaves. Que dius, no sé si tu ho feies, però jo de vegades havia pensat, va, em gravo una nota de veu i m 'explico aquesta idea, que així després ho faré. Després se m 'oblidava completament, perquè no tens mai l 'hàbit d 'anar

a buscar notes de veu, saps? Aleshores, bé, m 'he trobat que a la meva aplicació de notes de veu tinc notes d 'àudio del 2019, saps? De coses que vaig dir en el seu moment i que tenen molt de sentit, però ho tenien en el seu moment i la majoria no valen la pena. Però, clar. és una

cosa que no estava ben resolta. I ara, en canvi, m 'he fet un xorcat, sembla tonto, però simplement et fa, et permet gravar una nota d 'àudio, te la tira per xatxepeter, i llavors ja et torna una miqueta un algo, un output, amb un reminder, i llavors està bé, perquè llavors quan torno a casa, ho tinc allà, i llavors dic, ei, ja estic a l 'escriptori, ja puc accionar sobre aquesta cosa, i abans s 'hauria quedat... perduda a l 'arxiu de notes d 'àudio enregistrades que no

torno a obrir mai més, no? I ara, doncs mira, amb els shortcuts no sé fer d 'això, per tant, escolta, benvinguts i més propostes de shortcuts. És que les automatitzacions, o sigui, hi ha vegades que ho veus claríssim, perquè realment el mal que et fa... i la fricció que té fer -la és molt petita, llavors el mal que et fa és enorme i dius, vale, és claríssim que si ho faig això

s 'ho tindrà guanyant. Però hi ha aquelles que estan com en aquell territori de ningú, com, exemple, la de crear una nova gravació d 'àudio en QuickTime, que dius, a veure, tan complicat no és. Llavors penses, tampoc val la pena automatitzar -ho perquè al final tardes... 12 segons. Però clar, ho penso cada setmana i llavors em va com recordant i és més una automatització mental per treure't aquesta càrrega mental de pensar què vols fer, que no pel temps que treu. I per

això que dius de la nota, aquesta és bona. Jo també tinc una que a vegades... O sigui, a vegades tens com pensaments en brut, o sigui, no pensaments bruts, pensaments en brut, o sigui, poc polits, que no saps molt bé com estructurar -los en una nota i per guardar -te 'ls i per apuntar -los. Llavors jo tinc una conversa infinita que és el meu, com et diria, el meu refinador de notes.

Llavors bàsicament el que li dic és que jo aquí et tiraré un tema, et tiraré una cosa que no sé molt bé per on agafar -la, però que me la vull guardar perquè vull tenir consciència d 'aquesta idea. Llavors el que faré és que, primer, necessito que me la corregeixis si és factualment incorrecta, perquè pot ser que t 'hagi tirat una cosa que igualment no sigui correcta, o sigui, sisplau, si dic alguna tonteria, per favor, corregeix

-la. I dos, complementa -la amb altres coses que puguis pensar i dóna -me -la, amb un format. de dos paràgrafs perquè jo em pugui anotar a la meva llibreta. Nanu, això és or. O sigui, el 90 % de les coses que tenien allà haguessin quedat totalment descartades. Ara, en canvi, amb això penso, hòstia, intel·ligent, veus? No ho hauria pensat mai. La nostra vida ha canviat, eh? Bueno, jo he començat a aplicar allò que vas comentar tu fa ja molts episodis, que tenies

un refinador de prompts, no? Vull dir, dona'm el prompt que hauria de ficar per fer això. O sigui, et passo la nota poc elaborada, o sigui, poc polida, en brut, si tu vols. i que t 'ajudi a fer el prompt a base de fer -te preguntes.

I jo des que faig això, per certes tasques, vull dir, tasques que no té cap puto sentit, però per tasques més elaborades, tipus... en formes que hagis de fer o pensar una idea, preparar -te una reunió, etcètera, té molt més sentit que hi hagi aquest intercanvi dialèctic mitjançant el qual fer una miqueta d 'esculpir la idea a base d 'aquest intercanvi d 'idees. Per tant, fantàstic. A mi em va molt bé aquesta. Aquesta? A mi em recorda molt amb la relació, per exemple,

amb un advocat. O sigui, quin és el problema? El problema és que tu, quan poses un prompt que te l 'has inventat tu, penses, hòstia, és que potser no és òptim, saps? Potser li falta alguna cosa. Podries estar traient més d 'aquesta conversa i no n 'estic segur. En canvi, quan ho passes per allà, ella et dona alguna cosa que és com pau mental. Penses, val, si tu m 'has donat això, és el millor que jo puc aconseguir aquí. Això

és igual que un abogat, no? Llavors tu penses, estàs enfrentant a un ente que és la justícia, que no tens exactament molt clar com funciona, però dius, bueno, si ho diu l 'abogat, això és el que va a missa, no? Doncs això és exactament el mateix. Tu tens aquesta conversa, llavors ja no... has de preocupar de si ho fas bé, si ho fas malament o no, és que ho ha fet ell, és el que t 'ha donat. I això, per lligar -ho amb

el tema de... A veure com ho lliguem, això. No, no, no. És molt fàcil, però més que res, perquè era com una cosa que vam dir que ja havíem de parlar. No, perquè el format veu, al final de la intel·ligència artificial, clar, ens és molt més natural. I és una de les coses que... que hauríem d 'haver comentat ja en l 'anterior episodi i no ho vam fer perquè te 'l vaig sabotejar, però no ens han caigut demandes encara, per tant, seguim un episodi més sense demandes, està bé.

Bien, celebrem -ho. No, què vull dir? Ja ho hem mencionat més d 'una vegada, que d 'aquí cent anys o d 'aquí cinquanta anys els nostres nets diran que tontos, vosaltres, que burros, li escriíeu en un ordinador amb un teclat o alguna cosa, li parlàveu a les màquines amb tecles, és que és tontíssim. En realitat no és tontíssim, vull dir, és com ha funcionat. a l 'abans tecnològic. Sí, clar, i tu enrere deies, tu imbècil et mories d 'un encostipat, saps? Exacte. Exacte. Bé, sí,

exacte. Podíem anar a exemples encara més divertits, però... És evident que, més que la disciplina de processament del llenguatge natural, el llenguatge més natural que he parlat, en aquest sentit, a la ve d 'escriure, que en realitat és un reflex al nostre pensament, però no és 100 % fidel perquè ja aprens dresseres, no has cruzat les coses tal com les penses, és molt menys estructurat, etcètera. No acaba de ser el... la interlocució més òptima, el camí més òptim per arribar a la

idea. Tampoc ho és el llenguatge parlat tal qual el vomitem d 'idea poc pensada a un prompt. M 'explico. Tot aquest procés de refinament ha de formar part d 'anem a fer una tasca. Perquè un dels grans problemes que hem tingut històricament com a societat i sobretot a nivell de feina,

això ho veiem. Tu, segurament, Marc, has tingut algun jefe que et donava tasques de merda, o sigui, trobar -te amb coses super poc definides, molt genèriques, no estava clar què havia de fer aquella tasca, algun client que volia una pàgina web que no sé què a tu li interessa i al final és, no, però jo quan et vaig dir això volia dir aquesta altra cosa i no s 'ajustava

al que volies. D 'acord, per què? Perquè principalment la comunicació... o formal s 'ha fet de manera escrita, perquè sempre hem entès allò de si no està escrit, doncs el que està escrit va a missa, però en canvi les paraules se les endú el vent. Sí, fins ara sí, però en realitat no hi havia res més fàcil d 'enregistrar, si tu vols. que

una nota d 'àudio. El que passa que és raro que tu entres en una reunió i diguis, escolta, vull gravar la reunió perquè el contingut que em hagués sortit aquí és el que anirà a missa, no el que després posi el document. No es fa, per lo general no es fa. Aleshores, quan interactuem amb les intel·ligències artificials, al principi, i perquè al final ChatGPT va sortir com va sortir, hem adoptat primer la pràctica aquesta d 'escriure, no? I escriure, al final, són molt vagos, i més

si dones un xat. Si dones un xat en el que, com que el cost d 'escriure diverses vegades és infinit, ai, perdona, és infinit, és zero, t 'endeixes zero, perquè dius, bueno, poso una cosa i xatxepeta no ho entén, ah, espera, poso hitero, pam, pam, pam, i al final fas 8 o 10 o 15 o 20 iteracions perquè són gratuïtes per tu, i al final acabes arribant allò que vols amb un cost a nivell de temps o, de vegades, de pèrdua de context, o de pèrdua de qualitat de l 'output, és assumible.

Sí, en canvi, ho hem vist amb altres eines en les que tens uns crèdits i que, de prop, et gasten uns crèdits i que, per tant, has de refinar molt més allò que vols, digue -li un vercel V0 o alguna altra història que és un volt o altres d 'aquestes que sí que no tens crèdits il·limitats. I, per tant, tu has de pensar molt bé i dius, d 'acord, vaig a definir -ho el màxim possible perquè t 'han posat una fricció. Aquesta és una. Però

això és un escrit. I això, per la gent, pels conspiranoics, que els agrada pensar que els tòpics de foc a terra els traiem de les coses que parlo jo a la newsletter, doncs aquí faig una miqueta de la promoció que l 'últim episodi, l 'última newsletter que vaig enviar parlava del concepte d 'espagueti prompting, que al final

és l 'equivalent de l 'espagueti coding. però amb el no tinc clar, començo a escriure a la IA, ja arribaré al resultat i acabes fotent uns prompts horribles amb pèrdua de context i amb desviacions i al·lucinacions i molt difícil de mantenir. Fins aquí la part escrita i la podem debatre tot el que tu vulguis, però el focus on volíem anar avui és la part parlada. Aleshores, què té de bo la IA? En què ens ha d 'ajudar?

Un clar cas d 'ús, que és el de transformar aquest vòmit mental, aquesta diarrea que t 'acabo de tirar, que moltes vegades això acaba sent una nota d 'àudio, perquè sempre ens queixem de la gent que envia notes d 'àudio que són podcasts, doncs no, et tiro jo aquesta idea, tu processa -la i torna amb algo més concís, més preparat, més detallat i més útil per la persona que ho ha d 'escoltar. Jo crec que aquest és com el clar cas d 'ús. I a partir d 'aquí, moltes consideracions

poden entrar per on tu vulguis. És superinteressant. Abans, i et juro que parlarem de l 'àudio, però em deixaràs fer dos petits incisos. El primer, agafarem aquest pensament després, jo tinc la tesi que estem tornant a una cultura societat barra comunicació oral. I estem marxant una mica de la part escrita. Aquesta és la meva tesi.

Venim d 'una societat on l 'escriptura, com el període des que Gutenberg ens regala la premsa, està a dia d 'avui, on l 'escriptura ha sigut d 'un nivell jeràrquic superior a la cultura oral. De fet, abans no hi havia res escrit, per tant, abans era una cultura oral. I crec que estem tornant a això. Després, si vols, d 'aquest punt el podem obrir perquè crec que és molt interessant, quan agafem l 'àudio, però no em vull desviar.

El segon, i... Això ja és un pensament sobre aquesta tecnologia en general, que crec que he fet moltes vegades, però m 'agradaria reiterar, o sigui, l 'emocionat, sorprès, agraït que estic per tot plegat, perquè crec que és un molt bon moment per estar viu. En quin sentit? És una de les tecnologies, i amb això he canviat la meva opinió abans, potser la desmereixia una mica, ara realment tinc aquest punt d 'agraïment i de consciència del molt transformador que és.

Per diversos motius. El primer és que, generalment, totes les coses bones que ens han arribat venen com de dalt cap a baix, saps? És a dir, jo què sé, l 'electricitat, els avions, el GPS, internet. Són coses com que comencen en grans empreses i a poc a poc baixen cap a baix. El trickle -down. Exacte, el trickle -down econòmics. Mític. Vols que t 'expliqui un acudit de trickle -down econòmics? Sisplau, endavant. Sempre estic per acudits. Te 'l podria explicar, però el 99 % de la gent

no el pillarà. Que ben tirat, perquè has d 'esperar que trickle down, eh? Que bé, que bé. Ha, ha, ha. Bo, bo, bo, bo. Doncs escolta, aquesta... És a dir... És interessant. O sigui, amb aquesta tecnologia ha vingut totalment de baix cap a dalt. Molt curiós. I a sobre, a la gent que més l 'ha empoderat ha sigut a l 'autònom de turno

més que a la gran corporació. I podem argumentar sobre això, perquè al final, clar, és una tecnologia que és un... generalista brutal que, en canvi, una empresa que necessita gestionar problemes d 'especialista, possiblement li costa més adoptar -la, no? És a dir, per a les organitzacions ho tenen més difícil, perquè han de gestionar problemes d 'integració, normativa, seguretat, burocràcia, merdes d 'aquestes. En canvi, tu, tio, agafes i, escolta, i comences a funcionar. Aquest punt

és interessant. No dic que això pugui canviar en el futur, eh? Això és un... És una cosa d 'ara i és un moment molt dolç i s 'ha d 'aprofitar i és fantàstic. Primer aquestes dues coses. Ara entrem a la veu. M 'agrada que ho hagis posat en el context aquest del refinador de prompts perquè el que et anava a explicar també va una mica en aquesta línia del refinador del teu missatge

oral desestructurat com nota de veu. I crec que nosaltres hem contribuït a destruir unes quantes notes de veu per WhatsApp perquè hi ha molt poca gent que ja me les envia. Perquè quan... me les enviaven, els hi retornava l 'episodi on parlàvem de les notes de veu. Estic segur que hi ha algunes persones que han anat a escriure amb una nota

de veu i han dit, merda, no, l 'hi escric. Però, allà recomanàvem una cosa que és interessant i és el fet de dictar les teves paraules i que això es transcrigui directament com text que tu puguis enviar. Això fins ara era el que estava conegut com l 'estat de l 'art en les comunicacions de WhatsApp. És a dir, tu dictes alguna cosa i això ho envies. Clar, quin és el problema?

El teu problema és que per dictar alguna cosa has de tenir molt clar el que vas a dir, perquè evidentment has de posar un pensament una mica estructurat, perquè si el que fas és dictar -me la nota de veu, estarem en el mateix problema. Bàsicament em faràs llegir la teva merda mental.

Això seria com la tecnologia 1 .0. Llavors, l 'altre dia et vaig dir, hòstia, és que jo estic fent servir molt la veu amb xat GPT i més et diria que m 'estic quedant molt a casa per treballar per no molestar -me la gent que tinc al costat. La versió 2 d 'això seria, si tens xat GPT davant, veuràs que té com dos icones de veu, un que és un micròfon i l 'altre que és com una ona de veu així estranya. El primer és una eina molt semblant. És aquest dictat que simplement transcriu

les teves paraules. El que passa és que el model, en la meva experiència, funciona bastant millor per diversos motius. Primer és que no li tens que dir amb quina llengua parles. Gràcies. Amai jo és sí, aquí no. Aquí tu comences a parlar i ell t 'ho autodetecta. És més ràpid transcrivint i... és molt més acurat a l 'hora de fer la transcripció. Però infinitament. És a dir, per exemple, si començo a parlar en català i li solto dues paraules en castellà i una en anglès, ho enganxa perfecte.

És increïble. Funciona molt bé. Però, malgrat, encara tenim la part dolenta que es menja la diarrea mental. És a dir, si tu li dius estupideses, les estupideses es queden allà. I quan dic estupideses vull dir continguts desestructurats. Aquesta és la primera. La segona és el voice mode. que és el de la dreta, el de l 'ona aquesta de veu que poses allà. Això és totalment diferent. Això és l 'experiència de Herr. Ja no és que sigui

multimodal. És a dir, la tecnologia que hi ha darrere del primer és que simplement tu parles i allò transcriu i t 'ho posa en el prompt. Vale, perfecte. Aquí no. Aquí, directament, ell tokenitza el so. És a dir, tokenitza el so, no sé si és una paraula o no, però és el que fa. És a dir, en lloc de convertir el teu so amb paraules i les paraules amb tokens, això directament el que fa és que comparteix el so directament amb tokens. És a dir, tokenitza la teva ona de veu

i et contesta a corde. Per tant, és un model natiu de veu. Aquest a mi em sembla acollonant. Interactuar amb això a mi em sembla boig. Però això no et serveix per fer feina. Això et serveix per entretenir -te. És més curiositat, enriquiment personal, etc. Però això no serveix per treballar. Tipo què? Tipo què? Mira, molt bé. M 'agrada que em facis aquesta pregunta. Mira, per exemple.

Aquesta m 'agrada molt. L 'altre dia li vaig preguntar quines coses tu creus que són molt òbvies de la nostra societat que molts humans... desmereixen o no es fixen o no es miren. Vam tenir una conversa que vaig pensar, Déu meu, quin ser més intel·ligent és l 'amic més llest que tinc, macho. O sigui, em va donar unes respostes que vaig pensar, Déu -n 'hi -do, que interessant. I a partir d 'aquí li vaig dir, quins autors estan parlant d 'això? I quins llibres em recomanes

per això? O mira, l 'altre dia, estic una mica fascinat amb tota aquesta teoria del Younger Dryas, de Graham Hancock, de que... Realment, la civilització no ha crescut de forma lineal, sinó que hi havia una civilització bastant més avançada abans d 'un event d 'extinció que va haver més o menys fa uns 10 .000 anys. Llavors això ens va portar a la merda i vam reneixer d 'aquell event catastròfic. O sigui, el planeta

dels símios, bàsicament. O sigui, vam avançar en un altre vector tecnològic i la teoria està molt fonamentada, eh? No estem parlant de barrets de paper de plata, eh? No, no, no, no. Continuem l 'episodi anterior. És a dir, per exemple, eh? Per exemple. Marc, espera, espera, espera, espera. No serà d 'aquests que ara s 'està posant de moda allò de han descobert que sota les piràmides d 'Egipte hi ha uns cilindres que fan 18 quilòmetres de llargada, eh? No sé què. És això, no? No,

no és això. Ah, val. Encara que Graham Hancock és un dels que ho ha difós i sí que és veritat que ha agafat tecnologia de líder, l 'han posat per sota les piràmides i han trobat allò i és interessant, però el seu argument és el següent.

La civilització no ha crescut de forma lineal, sinó que teníem una civilització... força més avançada fa uns 10 .000 anys, en el qual va haver -hi un event de semiextinció de la raça, que es diu Younger Dryas, que és un cometa que va impactar la Terra, i això és real, no hi ha cap

dubte científic sobre això. L 'únic que hi ha el dubte científic és si realment això va tenir un impacte en la civilització o no. Llavors, ell argumenta que sí, i el que t 'explica és que les piràmides van estar construïdes per una civilització, no aliens ni coses d 'aquestes, vam ser nosaltres, però que tenien unes eines i una tecnologia molt... molt superior a la que va haver -hi en els pròxims 5 .000 anys per culpa

d 'aquest event. Bàsicament el que argumenta és que teníem una tecnologia molt interessant, ens estàvem progressant, i va haver -hi un asteroide que ens va enviar a la puta merda. I vam haver de començar de zero. I per això no hi ha restes d 'aquesta tecnologia, o què? No, no, et sorprendries, et sorprendries. És que no vull cotejar -te l 'episodi, si vols... Vale, va, va, va. Guardem -ho per... Una directa. Si vols, ho podem fer en la següent, perquè sí n 'hi ha, sí n 'hi ha.

Per tant, és molt interessant. Llavors, el resum de tot això és que, igual que tu, soc una persona molt escèptica sobre aquestes coses, em costa molt convèncer -me, malgrat canvi d 'opinió amb facilitat. I vaig tenir com aquesta conversa, per posar -te un exemple de conversa que vaig tenir amb el voice mode, que no és eminentment professional, però que molt enriquidora i molt més còmode de tenir que no pas escrivint tota l 'estona i tenint que llegir el que et diu.

Simplement això. És a dir, és com que et genera el teu contingut personalitzat ad hoc per tu. O sigui, de la mateixa manera que en Notebook .lem és molt interessant perquè li passes el contingut i et diu fes -me un podcast, això és encara més personalitzat. Li pots fer les preguntes que tu vulguis, o sigui, és com si estiguessis amb el host d 'aquell podcast, perquè, vulguis o no, és més intel·ligent que qualsevol persona del món. Per tant, li pots preguntar el que et

surti de les boles. És que jo abans no era tan conscient d 'això. Bueno, de fet, jo l 'he estat fent servir, però des que... Tu, per exemple, me 'l vas comentar fa un temps, i quan me 'l vas comentar encara no estava el mode de veu aquest avançat, el advanced voice mode, que és el que tu comentes de la forma, si no sóc ideal,

aquesta. I recordo que quan vaig provar el primer mode de veu, clar, era això, feia una transcripció, i ho has passat una miqueta per sobre, però està bé per no entrar en molts detalls tècnics, no? Però, clar, tu intentaves parlar... Aleshores hi havia la certa latència aquesta de primer havia de fer la transcripció, si per darrere estava fent la transcripció d 'audiotext i aleshores processava el text i t 'ho contestava. Aleshores l 'experiència per mi era subòptima i per això

no m 'ho vaig acabar de creure. Aleshores fa uns mesos vaig tornar a provar, perquè hi havia l 'advanced voice mode, em sembla que el vam comentar aquí al podcast i vaig dir vaig a tornar a provar. Ah, amic, aquí era una miqueta diferent. Tot i així jo mai he tingut encara l 'experiència

immersiva. d 'aquestes, de sentir -me d 'entrar en el flow, que tu em vas dir que ja havies entrat aquí, ja havies tingut una experiència del suspension of disbelief jo no he arribat en aquest moment d 'estar flotant en una en aquesta piscina de suero on els precocs de Minority Report estan allà veient el futur, jo això no ho he experimentat, però és veritat que, bueno estic fent El que vaig fer fa dos anys, de forçar -me mitja hora o una hora al dia a fer servir xat GPT per qualsevol

tipus de tasca, ara m 'estic forçant mitja hora al dia de fer -lo servir al mode de veu. I aleshores he tret algunes conclusions bastant interessants. La primera, i és molt òpia, i tu ja l 'has comentat,

que ara aquest model percege l 'àudio. Per no entrar en disquisicions massa tècniques, però vull dir, al final com funciona això és que en comptes d 'agafar i tokenitzar les cadenes de caràcters que seria el text desclosats, ja no per paraules sinó per número de caràcters i tot això, llavors ho processa fa una cosa que es diu feature extraction, perquè de fet l 'he fet servir perquè m 'expliqués com funcionaven aquests models, perquè dic hòstia, ja però l 'àudio exactament

com funciona, llavors clar és el que dius tu, fa un plot fa un anàlisi de com és les teves com es diu això, les zones de veu, la teva petjada de veu, i pot comparar diferents coses com els accents, la teva cadència, la teva velocitat a la que parles, altres tipus inclús d 'afectes de parla, etcètera, etcètera, això és molt interessant,

d 'acord? Llavors, esclar, jo, havent estudiat processament d 'àudio a la carrera, i saber el que és una transformada de Fourier, una convolució i tot això, doncs he pogut tenir una conversa més o menys informada i m 'ha anat molt bé, i dic, ah, ara ho entenc, i he tingut una miqueta de moment eureka. Això per un canto. L 'altra cosa que trobo del moda veu és que no és molt concís. No li agrada anar... No és straight to

the point. M 'explico. Com que estàs en moda, vaig a fer un volcat de memòria i, per tant, un volcat cerebral i, per tant, no he pensat molt bé exactament el que vull i costa molt fer un prompt molt llarg perquè penses que... O sigui, jo almenys... Jo soc una persona extremadament insegura. Les persones que som extremadament insegures hem d 'intentar parlar més ràpid perquè pensem que en qualsevol moment ens interromperan i l 'altra persona ens parlarà per sobre, ens

xafarà. Llavors hem d 'aprofitar aquestes finestres d 'oportunitat que tenim i per això, generalment, les persones insegures parlem molt ràpid i atropellem de vegades. Però és més que res perquè... pensem que, merda, merda, merda, l 'altra persona s 'està posant impacient i ara m 'interromprà i se'm menjarà. Doncs aquí passa exactament el

mateix. Comences a parlar d 'itxat GPT, perds una miqueta el fil, dius, merda, espera, que no he acabat el prompt, però no sé si exactament t 'he dit tot, com que a més no ho estic veient. Jo estic perdent el fil perquè m 'estic desconcentrant, perquè, hòstia, he de creuar el semàfor o he d 'estar pendent d 'aquesta altra cosa. I si faig una micropausa... ChatGPT ja em tirarà la resposta, saps? Entendrà que allò és el final

del prompt i em tirarà la resposta. Merda, merda, merda, això et posa més pressió i al final acabes fent un cagarro de prompt inicial. Total, que això força que t 'hagis de menjar la seva resposta, esperar i dir, no, espera, en realitat el que volia dir és això, torna a l 'explicar, pam, pam, pam. A mi això em resulta extremadament ineficient i molt incòmode, per un cantó. Una

cosa bona... Si ara que he dit una cosa dolenta, doncs una cosa bona, per exemple, sí que m 'agrada que pot ajudar -te en coses en les que fins ara no et podia ajudar, perquè estava processant text, m 'explico, i això ja ho he comentat a la newsletter i crec que ho he comentat algun cop per aquí, que és, per exemple, faig exercicis de pronunciació. Em pot ajudar a pronunciar millor certes paraules que en anglès se me 'n callen.

Hi ha paraules que a tu segurament et passarà, si parlem molt bé anglès, però hi ha paraules que no les fas servir mai o no les has sentit mai i, per tant, no saps com es pronuncien, I, o són complicades, vull dir, jo què sé, a mi sempre m 'han gustat certes paraules tipus throatput, saps? Hòstia, el que val, és que no sé ni com es diu en català, saps? Vull dir, però és com un, d 'aquelles paraules que és merda, tampoc és que la fa servir molt sovint, però a nivell

tècnic la fa servir, no? Llavors, hòstia, ajuda'm a pronunciar això, o certes altres paraules o expressions que se'm queden allò, se'm queden encallades, val? I llavors, com que pot entendre això, està guai. De fet, mira, un exemple que vaig compartir fa poc era el d 'aquell altre dia. Fent exercicis de pronunciació, Em va dir, avui estàs parlant més ràpid de lo normal, tens

la respiració entretallada. Això fa que cometis més errors perquè parles més ràpid i no pots focalitzar -te en fer l 'estrès a l 'accent, diguem, a la síl·laba que toca. Diu, això pot ser que estiguis que hagis acabat de córrer o que estiguis fent exercici. I curiosament aquell dia estava fent centadilles, saps? I dic, fill de puta, m 'ha pillat fent centadilles. I això, que la qual, tio, per què? però això ho ha tret. I llavors li vaig preguntar, dic, hòstia, com

ho has tret això? I m 'ha dit, mira, i va entrar a nivell molt tècnic de dir, doncs la teva cadència generalment és més o menys així, tal, tal, tal. Noto que fas més pauses que van més seguides una respiració que va correlacionada amb una freqüència cardíaca més alta, tal, tal, tal. I vaig dir, dic, me cago en la puta, sí, m 'ha pillat. I ja està. Amb la qual cosa, segurament d 'aquí també hi ha uns tipus de negocis derivats

d 'això que encara... No ho haurem vist en una audiència més generalista, però que poden tenir molt sentit, és a dir, identificació de persones pel patró de veu que tens, no? Correcció de parles, és a dir, substituir el collons de Duolingo, que sempre ho dic, que no és una aplicació d 'idiomes, sinó que és una aplicació d 'hàbits, i ja està, per a alguna cosa molt més útil. Jo les converses que tinc amb Xatxepete, que de fet, clar, una altra cosa que faig és parlar

-hi cada dia. amb un idioma diferent per poder anar practicant, saps? Perquè jo, què sé, amb els anys he deixat de practicar, de parlar en alemany, de parlar en italià, o el grec que estic aprenent ara, i, joder, doncs ara ja no tinc excusa. Fins ara era, no, és que, clar, ara ja no visc amb alemanys, amb italians, i, aleshores, podia parlar cada dia, els meus amics, experts, ja no viuen a Barcelona, i tal, tal, tal. Ara no, tio. Tinc un amic èxpat a la meva butxaca.

Puc parlar en l 'idioma que jo vulgui, al nivell que jo vulgui i sobre el que jo vulgui. No m 'he de menjar les putes frases aquestes estúpides de Duolingo de el cavall menja sal i al meu gos no li agrada la síndria, saps? Vull dir, no, no vull parlar de gossos que mengen síndria. Ajuda'm a practicar un episodio de pot. Jo què sé, saps? Vull dir, a mi, si em volen entrevistar a nivell de negocis en italià, doncs he fet...

50 .000 entrevistes i podcast en italià, és veritat que ara fa anys que no ho faig i potser estic una miqueta més rovellat, però no em costa gaire. Així me 'n sortiria perfectament. Per l 'alemany, per exemple, he perdut tot l 'alemany de business, que tampoc mai vaig tenir del tot, però poder practicar almenys una reunió, una presentació, un vídeo que m 'hagi d 'enregistrar dient no sé quines coses, fantàstic, això ho puc fer.

És perfecte. Si tens un professor... el teu as per qualsevol cosa, el que dius tu, és la persona més intel·ligent del planeta, per tant, fes -ne servir perquè t 'expliqui coses, i tingues aquest debat, o sigui, aquest intercanvi dialèctic, socràtic, per arribar a la veritat a través de l 'intercanvi de preguntes. Jo això ho trobo extremadament útil. És increïble, és que la tecnologia és brutal, i mira, i cadascú li troba com el seu ús... No ho sé, a mi, de veritat, em té totalment

comprat, llavors. M 'agrada perquè hem fet aquesta distinció. Mira, tecnologia bàsica és el dictat aquest del telèfon, que has de definir l 'idioma, tal. Això ja no ens agrada. Això ja és tecnologia del segle XIX. Fora, ja no ens interessa. Llavors, ara què tenim? Tenim la transcripció directa.

que ens va bé per transcriure sense tenir -li que dir quin idioma parlem, estructura millor els textos, etc. I després tenim el voice mode, que hem dit que no ens serveix professionalment perquè les converses es queden una mica efímeres i, com tu dius, és com un podcast per tu amb la persona més intel·ligent del món. Perfecte. Un apunt només. Sí, un apunt. No són efímeres, per realitat. Tens la traducció allà, de fet,

la transcripció. Sí, correcte. De fet, jo faig servir la transcripció per després generar -me contingut en base a això, de dir, escolta, de tot això que he tret, perquè em passa amb una descripció per línia d 'aquesta tasca perquè jo vull escriure tal cosa, pum, i t 'ho dona, saps? Vull dir que realment pots, així com en un thread de text, probablement tindries de l 'ordre de 10 intercanvis fins que arribes a l 'output final, clar, amb àudio, la conversa que

he tingut avui ha estat 32 minuts. 32 minuts han donat per 200, no ho sé, no m 'ho he comptat, però 200 o 300 intercanvis. Per tant, d 'allà tens moltíssim material, és infinit. Sí, potser em referia com que la UI que et dona la resposta no és com la transcripció paraula per paraula igual que amb l 'altra, saps? És a dir, que si no que tens com aquesta espècie de resums en un costat i a l 'altre. Però que sí, sí, et compro

la idea. Aquí el que volia arribar és que pels més aventurers que volen treure el millor del voice mode, però portar -ho a l 'àmbit professional, i és aquest concepte d 'estar -hi parlant a l 'ordinador, que és bastant divertit en si mateix, hi ha algunes aplicacions, com la que et vaig mencionar l 'altre dia, que es diu SuperWhisper, que són prompts prefabricats o que tu pots customitzar on tu allà dins hi tires el teu àudio i directament

surt la resposta final. Exemple. Tu imagina't que tu vols crear una tasca, però és complexa, i tens aquesta por de que, merda, parlaré ràpid, diré coses que no toquen, el confondré, li faré un prompt de merda, etc. Això el que t 'està fent, a veure, això fa moltes coses, però una de les, penso, millors funcionalitats que té

és aquesta. És que tu li tires l 'àudio allà dins i allò ja té un pre -prompt directe que és ordena'm això, posa -m 'ho en forma de tasca, seria com l 'optimitzador de prompts aquest que fem servir, seria el mateix per l 'àudio. I llavors, tu què passa? Tu ja directament tens com una adrecera de teclat en què la cliques, llavors això ja t 'escolta. Li passes l 'àudio, ho pots fer en local o té un model en el cloud, pots

triar. Inclús pots posar les teves claus d 'OpenAI o de qui paguis i directament fer servir aquella API. Però el seu model funciona molt bé. El tio té un bon producte, eh? I és que pots crear diferents modos amb diferents prompts a l 'entrada, no? És a dir, si tu en vols un per escriure correus, doncs ja directament té com una entradeta i una sortida pel teu correu. En pots fer un per guardar notes, en pots fer un per donar instruccions.

I està bé perquè... Igual, si vols entrar en aquesta roda, i això ja és per usuaris bastant avançats, jo dic, eh? A mi sempre em passa el mateix. Primer me 'n vaig a l 'extrem i llavors torno en els bàsics. Exemple, vaig estar fent servir això durant un temps, però vaig pensar, potser és tomatge, saps? Vull dir, si ja tens CGPT que et porta al 80%, tampoc cal. Llavors... Simplement el que faig és que m 'he intentat

recrear aquest producte dintre del xat GPT. O sigui, tens com una conversa en la qual tu li dius, escolta, aquí et tiraré els meus bruts d 'àudio que necessito millorar, llavors necessito que em tornis el prompt una mica ordenat i una mica escrit i que em treguis els es, els pero, els bàsicament i els... O sigui... De fet, aquest últim punt que has dit és molt interessant, el de m 'estic intentant replicar aquesta eina amb... amb XatGPT, que és... És una actitud molt catalana,

sí. Val, no volia arribar aquí, però és una de les revelacions que he tingut jo. en aquests mesos últims, vull dir, quan dic aquests mesos últims, potser són els últims 12, però que és la majoria d 'apps d 'aquestes de Amiga i tal, al final acaben reduïdes a HPT, saps? Vull dir, les pots fer allà i arribes al 80 % dels casos.

Crec que vaig explicar l 'exemple, no?, d 'aquesta interfície, vaig voler desenvolupar com un mock -up d 'una aplicació i tal, i vaig anar, vaig provar Bolt, i vaig provar no sé què, i vaig estar perdent hores i hores allà i algun crèdit, i de fet... Vaig fer -ho després molt més ràpid, en cinc minuts ho tenia fet. Potser és un exemple una miqueta banal, però aquest que has compartit

tu ja serveix. És a dir, en realitat, crec que el guany més essencial que a mi m 'està donant la guia és el de saber que amb un esforç mínim puc arribar a aquest 80 % i ja està. Intentar arribar al 100 % no té sentit perquè el... el downside d 'intentar -ho és molt millor que l 'upside. No hi arribaràs i realment té un cost infinit. En canvi, quedar -te al 80%, l 'upside és boníssim i el downside pràcticament no existeix.

Per tant, amb aquest càlcul, amb aquest equilibri de costos o d 'escenaris, entre el millor i el pitjor escenari, em surt a compte. I aquest, si t 'hi fixes, és l 'exemple que jo he explicat a Duolingo. És a dir, jo no faig servir Duolingo, tio, si m 'ho he deixat, perquè ja no té sentit,

tio, estic aprenent més amb això. Clar que és veritat que una cosa que perds és com certa metodologia, o sigui, quedes a mercè de les metodologies amb les que pugui haver estat entrenada, que pugui, ja no, inferir no, perquè no infereix, però vull dir, que pugui tenir allà, és a dir... Tu has de saber dir -li, ei, vull que practiquem amb aquesta metodologia. És a dir, si tu ara fas un freerider de vull aprendre anglès amb el xatxepeté, ok, o sigui, bona sort. Arribaràs a un lloc,

però vull dir, segurament t 'encansaràs. perquè no li has especificat amb quina metodologia vols servir, amb quina cadència, amb quin to, quin és l 'objectiu, si prendràs notes o no prendràs notes, si vols material audiovisual o no. Hi ha 50 .000 consideracions que s 'han de tenir en compte, que per això existeixen les metodologies i els centres especialitzats. Però si tu tens clar per on vols tirar, que és el que diem sempre, si tu tens coneixement sectorial d 'allò en què

vols aprofundir, pots arribar llunyíssim. El problema és que no ho fas sense mètode. Sabeu que hi ha molts més casos del dia a dia que podem fer xarxa a GPT? Ara, recentment, amb el nou model d 'imatges, doncs, bàsicament, s 'està

follant Photoshop, bàsicament, saps? Vull dir, bueno, en el punt en què ja, si et genera el text bé, si ja et permet fer correccions d 'aquestes específiques en només una àrea, però mantent -me tota la resta de la imatge, l 'únic que vull és que li canviïs el color de l 'aigua del mar que sigui vermella amb gotes de blava, i t 'ho

fa bé. i de fet, inclús si pots anotar coses a la mateixa imatge i et llegeixes les anotacions de dins de la imatge, no cal que sigui dins del text, estem arribant a uns nivells de perfecció que dius, bueno, ja arribo a un punt en què és que no em cal Canva. Canva no, Canva, perdona,

Canva. No em cal Photoshop. Evidentment que si vull fer una cosa molt, molt específica i tal, i pixel perfect, i 100%, com jo la vull, si vols estar ben servit, fes -te tu mateix al llit i, per tant, aprens disseny gràfic o et contractes un dissenyador o dissenyadora que t 'ho faci, I ja està, i aleshores arribes, però pel 80%. I crec que això serà una mica la tendència que ens ve ara, que tot estarà al 80%, d 'acord? Per què? Perquè ja és un... el que diem, no?

Don't is good enough, no? Or good enough is good enough, no? Allò està suficient bé, ja està, ja està bé. Per tant, anticipo una miqueta més de mediocritat en aquest sentit, saps? I molta més volatilitat. Pel fet que, de fet, no són les consideracions del voice mode que no hem

tractat abans, eh? Que és, així com el mitjà escrit és més visual i, per tant, un tuit és més fàcil que es faci viral perquè li passes a algú, aquella persona ho veu, en mig segon i fa un fórmula a una altra persona i allò es pot retuitejar i ja està, la consumició d 'aquell

text és immediata. Si perdem el format visual i passem a una societat en la que només és àudio, que jo ho trobo una miqueta utòpic i segurament un altre dia podem aprofundir més en el per què, si passéssim a ser només àudio, es perdria la viralitat de les coses. Per què? Perquè per escoltar unes declaracions xungues d 'algú, doncs potser li has de perdre 15 o 30 o 45 segons o dos minuts i això li perd immediatesa i va en contra dels ideas de la societat, que és contra més ràpid,

millor. Saps? Com més consist, millor, i com menys hagi de pensar, millor. Per tant, si ara m 'he de menjar... I això ja ens passa, tio. Oi que no et fa mandra que quan tu vas a buscar alguna cosa a Google, els millors resultats siguin un vídeo de YouTube on t 'expliquin, no, tio, jo no vull saber això, saps? Vull dir, digue -m 'ho en text. Quin és el temps de cocció dels huevos Benedict? No em poses un vídeo que m 'he de menjar 3 minuts per saber exactament on ho

dius i quan ho dius no sé si... No hauré tingut en compte totes les altres connotacions que tu has volgut dir abans, que dir, ah, bueno, però això només passa si ho fas amb vitroceràmica, per dir alguna cosa, no? No ho sé, tio, vull dir que realment perds molt el context, d 'acord? En canvi, doncs, en un format més visual, doncs està allà escrit, tio. Aleshores, tinc la impressió que va en contra dels temps que corren al voler allargar el temps de consumició del... del contingut

que se 'ns presenta o que volem consumir. Sí. Sí, sí, ho veig. Què? On t 'has quedat? Però no em deixes de... No em deixes superconvençut amb el tema de la cultura oral. O sigui, cada cop veig que societàriament ens estem movent més a una cultura oral i potser no tan oral, però potser més efímera, en el sentit que... per mi oral també és el... molt més visual en

el sentit de, per exemple, veure un meme. Ens quedem més amb aquesta idea, amb aquesta imatge mental que no pas amb el capítol del llibre.

No ho sé, tindria que processar -ho una mica més, igual quan fem el conspiranoic del Graham Hancock amb el de les piràmides i la cultura i la civilització perduda, potser podem també... podem treure això, però jo crec que venim molt acostumats d 'una cultura escrita on posem... l 'escriptura a una jerarquia superior que el missatge oral, jo què sé, quan sorties publicat,

doncs això tenia una autoritat brutal, no? I ara pràcticament, vull dir, el fet de ser publicat, vull dir, s 'ha degradat una mica aquesta idea. En canvi ara, no sé, és com que tenim més eines per tenir com aquesta comunicació... De manera molt individualitzada i sistemàtica amb les màquines. He de formular millor aquesta idea, perquè no la tinc treballada encara. Una cosa en la que sí que aplicarem el format visual és els episodis

en directe nostres, que tornen. Els episodis tornen, sí senyor, a partir del dia 15 de maig. Si no pot ser abans, jo he demanat que se 'n faci un a l 'abril, però a veure si ens el donen. Ens el donen? El primer, el 15 de maig, confirmadíssim. Sempre prioritat pels nostres patrons, que fan possible tot plegat, eh? Sí, si podem sorprendre -us amb un episodi ara a l 'abril, fantàstic. Si no, ja ens veurem al maig. Oh, noies, que és Setmana Santa, ara! Clar, què fas tu per Setmana

Santa? Doncs no res, tio, mira, sorprenentment no anem enlloc. Al contrari, aprofitarem per quedar -nos a casa, descansar, veure gent, que tenim molta gent acumulada, amb la qual hem hagut de cancel·lar molts plans últimament, i per virus diversos i malalties diverses, i aprofitarem per fer una setmana santa de recolliment i visites

socials a casa. També calçotades, tinc una amiga aquí a Holanda que torna, per tant, Bueno, aprofitarem per veure gent, per socialitzar una miqueta i a veure si tinc una miqueta de temps a treballar en algun side project, tio, que també tinc ganes. A veure, gràcies a la guia estic tirant endavant i a veure si en puc parlar algun dia, que ets ben aviat. O no t 'ho deia, perquè com que tu ets una persona que tens canalla a casa, doncs fas vacances d 'aquestes d 'escola, de les bones,

eh? Ah, sí, exacte. Evidentment, totes estan condicionades. Quan hi ha canalla a casa, sempre hi ha els horaris i els calendaris i tot això van condicionats a ells. Tu què faràs? Doncs el mateix que tu, però sense canalla. O sigui, reclutament espiritual, tranquil·litat, poca festa i tranquil·litat, sense cansar -se gaire. Sense canalla, vaja. Et recomano una cosa que hem tornat a fer aquest any, que feia molts anys que no fèiem, que és veure el Barça, tio. Està...

Està molt interessant aquest any. Està realment el partit d 'ahir, el 4 -0 al Borussia Dortmund, senyor partidàs, i estic tornant a disfrutar amb el Barça com feia molts anys que no passava. Així que si no tens res a fer és una bona cosa per fer. Deixa'm dir -te que ja saps que jo l 'únic esport que segueixo activament és la Fórmula 1, però segueixo de manera semidistreta el Barça quan juga en aquests partits una mica importants.

I ahir el vaig veure. Estava assegut amb un altre dispositiu mentre la televisió es projectava el Barça. Jo també, estava fent feina mentre el mirava, però perquè vaig tenir força coses durant el dia, tipus anar a veterinari i fer altres gestions i tal, i vaig haver de fer...

La feina del dia la vaig haver de fer la nit, però sí, oi, hi havia moments que em quedava, em va de llit amb el partit, dient, hòstia, Déu -n 'hi -do, feia temps que no veia l 'equip tan enxufat i tal, però bueno, escolta, que mostrem a la gent que tenim altres inquietuds fora de... fora de la tecnologia i de parlar de nosaltres mateixos.

Transcript source: Provided by creator in RSS feed: download file
For the best experience, listen in Metacast app for iOS or Android