Instrumente de productivitate alimentate de Inteligența Artificială (AI) - PowerPoint

Silviu Toderas

Azure System Engineer

silviu.toderas@alef.com

Haideți să spunem lucrurilor pe nume - prezentările mai mult sau mai puțin publice pot fi foarte stresante, dintr-un număr variat de motive. Când acest lucru se întâmplă, amigdala cerebrală intră în acțiune, palmele transpiră, respirația e crescută, și așa mai departe. Majoritatea suntem familiari cu aceste manifestări, chiar și cei care fac asta în mod regulat.

De cele mai multe ori, e vorba de anxietatea prezentării publice în general, însă uneori, și de alte motive precum calitatea conținutului și a design-ului prezentării, dar și de aspecte legate de elemente personale de prezentare, cum ar fi adaptarea conținutului la tipul de public, încadrarea în timp sau modul de expunere verbală cât mai eficient.

Demarat în 2016, proiectul PowerPoint Designer țintește către implementarea și distribuirea unor mecanisme facile și rapide, care să preia o mare parte din efortul depus de creator, permițându-i acestuia să se concentreze asupra conținutului și mesajului ce trebuie transmi și, în mult mai mică măsură, să se preocupe cu motive de genul temei de culoare potrivite, colajele de fotografii, alinierea elementelor, găsirea elementelor grafice potrivite cu textul, și așa mai departe. Și deși a avut parte de o utilizare modestă în primul an de existentă, începând cu sfârșitul lui 2017 a explodat în utilizare, un an mai târziu ajungând
la 1 miliard de slide-uri generate, iar în ziua de azi generând 4.1 milioane de slide-uri pe zi (48 pe secundă).

Bineînțeles, piatra de temelie a acestui succes nu este alta decât inteligența artificială. Iar boom-ul în utilizarea funcționalității a crescut în același ritm precum folosirea ecosistemului de Machine Learning (ML) din Azure pentru antrenarea modelelor ML care stau la baza ei. Eliberarea de constrângerea utilizării unei arhitecturi fizice pentru crearea și antrenarea modelelor a însemnat o mult mai rapidă dezvoltare și adaptare a acestora, folosind infrastructura cloud, ceea ce a permis și îmbogățirea numărului de sugestii. Si pentru că tot vorbim de modele ML, e demn de menționat că PowerPoint Designer încorporează multiple modele, cum ar fi cele de vision, natural language processing, list ranking sau multi label classifier. Și bineînțeles, se folosește de arhitecturi complexe de tipul DNN (Deep Neural Networks) și chiar multi-layer DNN.

Dar cum se traduc toate aceste modele în ceva ce este tangibil pentru utilizator?

Să luăm câteva exemple:

Vision este modelul care se ocupă de interpretarea imaginilor ce sunt utilizate în slide-uri, înțelegerea conținutului lor, și montarea lor în pagina.
Patru poze total aleatorii cu pisici, inserate într-un slide,

pot duce la următorul rezultat:

Presupunând că vorbim de un utilizator comun de PowerPoint, ne putem imagina efortul depus și câte click-uri au fost salvate prin folosirea acestui proces, mai ales dacă era prima oară când generam un astfel de layout grafic.

Să luăm alt exemplu:

De aceasta dată, vom valorifica modelul de "natural language understanding " (NLP), care va înțelege că  textul pus de noi în pagină are de-a face cu elemente cronologice. NLP se va uita la întreaga structură a textului și înțelesul său global și apoi va aplica un layout corespunzător care să îl pună în valoare.

Un alt aspect unde Designer aduce valoare este și iconografia. Plecând de la un text simplu de genul celui de mai jos, 

putem ajunge în câteva secunde la un slide gata de a fi prezentat, cu icon-uri care reflectă textul din fiecare element al listei.

Iar partea și mai frumoasă este că dacă icon-urile sugerate nu sunt tocmai pe placul utilizatorului sau nu sunt tocmai cea mai fericită potrivire, creatorul le poate schimba manual, iar această schimbare se va reflecta înapoi într-un ”data lake”, unde va fi folosită pentru training-ul ulterior al modelelor de machine learning.

În vara lui 2019, echipa din spatele produsului a adăugat și mai multă inteligență în acesta.
Dacă layoutul unei prezentări trebuie să fie in-line cu brandul companiei (culorile, logourile, artefactele, fonturile, și așa mai departe), PowerPoint Designer poate să acomodeze această nevoie și să producă sugestii care să fie cât mai aproape de brand, folosindu-se în același timp de elementele de design din Slide Master, dar și de conținutul slide-ului în sine. În felul acesta, experiența e îmbunătățită și reduce nevoia de improvizație și ajustări manuale.

Iar pentru cei care nu au încă un brand stabilit, sugestiile de teme din Designer pot fi o alegere excelentă care să permită crearea ușoară și rapidă a unei prezentări reușite.

Această funcționalitate va lua în considerare contextul conținutului text prezent pe slide și va sugera fotografii high-quality, statice, dar și GIF-uri animate, ce pot fi folosite ca  bază de prezentare pentru introducere, cu încorporarea temei generate astfel în slide-urile ulterioare.

Existența unor numere mari în prezentări poate fi destul de greu de digerat și conceptualizat de către public. Studiile au arătat că dacă reprezentăm asemenea numere ca referință la ceva familiar, gradul de înțelegere și retenție a acestui tip de informație va crește.
Având în vedere următorul text simplu, un slide banal ca cel de mai jos,

se poate transforma în ceva mult mai atractiv vizual și intelectual:

Această funcționalitate are în spate ”Microsoft Research’s Perspective Engine”, un instrument AI care ajută în transpunerea numerelor mari într-un context familiar. ”Perspective Engine” e deja incorporat de multă vreme în motorul de căutare Bing, unde aduce la suprafață aceleași informații și trivia interesante. Conceptul de transpunere nu e nou, de altfel, fiind folosit în anii 90 de către Bill Gates pentru a ilustra capacitatea de stocare a unui CD-ROM, însă acum beneficiază de puterea modelelor de machine learning.

 

Ce se află sub capota lui PowerPoint Designer?

Echipa de ingineri care se ocupă de acest feature se bazează masiv pe utilizarea ecosistemului de Azure Machine Learning și a practicilor de MLOps (echivalentul DevOps pentru ML) pentru a crea diferite pipeline-uri, cu ajutorul cărora tehnologia prezentă azi în PowerPoint este continuu îmbunătățită fără ca disponibilitatea pentru utilizator să fie afectată.

Totul începe cu datele anonimizate primite de la utilizatorii de PowerPoint ce folosesc Designer, date ce sunt stocate în data lake-uri. Datele sunt ulterior procesate și transformate prin tehnici diverse specifice, până ajung într-un format utilizabil ca și input pentru modelele ML. De altfel, aceste modele sunt retrain-uite la intervale regulate folosind datele noi din data lake, echipa de engineering experimentând frecvent pentru îmbunătățirea modelelor prin ajustarea hyper-parametrilor, operațiuni necesare pentru obținerea unui scor mai bun al simulării.
Noile modele sunt apoi deploy-ate în arhitectura bazată pe micro-servicii a Design-erului și monitorizate îndeaproape.

Acum că am creat niște prezentări spectaculoase, mai rămâne un singur lucru de făcut. Să ne repetam speech-ul în vederea prezentării reale.
Practica repetiției se face de mult timp fie cu ajutorul unui partener care să simuleze publicul și care să ofere feedback, fie prin înregistrările audio-video proprii și parcurgerea acestora în căutarea elementelor care pot afecta negativ o prezentare, sau a celor ce necesită ajustări sau îmbunătățiri.

Însă acum, când știm că avem avantajul inteligentei artificiale de partea noastră, situațiile acestea se vor întâlni din ce în ce mai rar în viitor. Asta datorită noului feature numit "Presenter Coach", care, având la baza o colecție de bune practici, ajută speak-erul în a transmite mesaje puternice, fluide și coerente.

Concret, funcționalitatea are un mod de ”rehearsal” ce ne va indica, în timp real, tot soiul de lucruri relevante pentru o prezentare, precum tonalitatea vocii, monotonia prezentării, dacă citim prea des de pe slide-uri, dacă folosim un limbaj "inclusive" (situațiile în care ne adresăm publicului cu "you guys" deși publicul nu e în totalitate format din bărbați), ne atenționează când folosim prea multe cuvinte de umplutura precum "errrr","ummmm" și "aaaa", sau ne face conștienți de situațiile când folosim fraze ce pot fi cultural incorecte sau care să afecteze.
Iar la finalul fiecărei sesiuni de repetiție, vom beneficia și de un raport detaliat, cu metrice concrete și sugestii de îmbunătățire.

Această funcționalitate se afla momentan în preview gratuit pentru PowerPoint Web și suportă doar limba Engleză. Asta înseamnă că, pentru a putea repeta, trebuie să deschidem prezentarea în browser, în loc de clientul normal instalat local.

Puteți citi mai multe despre aceasta funcționalitate la https://support.microsoft.com/en-ie/office/rehearse-your-slide-show-with-presenter-coach-cd7fc941-5c3b-498c-a225-83ef3f64f07b .