Autorius: Julius Belickas; Publikavimo data: 2020-06-14

Šioje dalyje aprašyta Telend Open Studio aplinka, pagrindinis jos langas, Talend dažniausiai naudojami komponentai su trumpu jų aprašymu.

Prieš pradedant susipažinimą su aplikaciją ir jos pagrindiniai komponentai sudiekite kompiuteryje Talend Open studio.

Pirmas programos įjungimas

Pirmą kartą po įdiegimo paleidus Talend Open Studio išvedamas duomenų transformavimo/integravimo projekto pasirinkimo/sukūrimo langas.

 

Lange pasirinkite naujo projekto sukūrimo būdą:

  • norėdami kurti naują projektą, pasirinkite „Create a new project“ ir tekstiniame lauke įveskite projekto pavadinimą;
  • norėdami importuoti turimą projektą, pasirinkite „Import an existing project“;
  • norėdami dirbti su Talend bandomuoju projektu, pasirinktie „Import a demo project“.

Pasirinkę norimą variantą, spauskite mygtuką [Finish].

Kadangi naujai sudiegta programa dar neturi nė vieno egzistuojančio projekto, todėl juos galite tik sukurti arba importuoti. Sekantį kartą paleidus aplikaciją (Po naujo projekto sukūrimo ar importavimo) galėsite pasirinkti ir iš egzistuojančių projektų sąrašo.

Jeigu planuojate dirbti tik su vienu projektu, tuomet nuimkite varnelę nuo žymimojo langelio „Always ask me at startup“ – tai padarius, kiekvieną kartą paleidžiant šią studiją projekto pasirikimo langas bus praleidžiamas ir studija bus paleidžiama greičiau.

Susipažinimas su projekto kūrimo/redagavimo aplinka

Pirmą kartą paleidžiant Talend Open Studio projektą, automatiškai parodoma prezentacija, trumpai nupasakojanti, kaip naudotis aplikacija. Kai programa paleidžiama nebe pirmą kartą, prezentacija nebebus rodoma, tačiau norint pakartotinai ją vėl peržiūrėti, galima pasirinkti meniu „Help > Studio Quick Tour“.

Pagrindinis darbas su aplikacija vyksta projekto kūrimo/redagavimo lange (Kai pasirinkta langų atvaizdavimo perspektyva „Integration perspective“):

 

Projekto kūrimo/redagavimo langas sudarytas iš kelių pagrindinių komponentų:

  1. Projekto elementų saugykla (ang. Repository). Šioje dalyje atvaizduojamas integraciniame projekte panaudotų parametrų sąrašas, užduotys, verslo modeliai, dokumentacija, metaduomenys ir pan..
  2. Projektavimo langas (ang. Job Designer). Šioje dalyje projektuojamos užduotys bei konfigūruojami jų komponentai ir tarpusavio ryšiai. Čia gali būti atvaizduojami tiek užduočių modeliai tiek ir verslo modeliai.
        2.1 Kiekviena užduotis gali būti atvaizduojama vizualiai arba išeities kodu – po atvaizdavimo langu atitinkamai pasirenkant skirtuką „Designer“ arba „Code“.
        2.2 Projektavimo lange pasirinkus komponentą ar ryšį jis gali būti konfigūruojamas skirtuke „Component“.
        2.3 Užduoties paleidimas inicijuojamas ir konfigūruojamas skirtuke „Run (Job {Užduoties pavadinimas})“.
  3. Komponentų paletė (ang. Component Palette). Šioje dalyje atvaizduojami standartiniai Talend komponentai, kuriuos galima panaudoti projekte. Detaliau pateikiamas dažniausiai naudojamų komponentų aprašymas: komponentai

Dažniausiai naudojami komponentai

tFileInputDelimited – naudojamas failo nuskaitymui. Komponentas atidaro failą ir perskaito jį eilutė po eilutės, kad atskirtų jas į laukus. Laukus tada išsiunčia per Row nuorodą į kitą komponentą tokius, kokie jie aprašyti schemoje. Šis komponentas plačiau aprašytas skyriuje tFileInputDelimited.

tFilterColumns – komponentas naudojamas homogenizuoti schemas rikiuojant stulpelius, šalinant nereikalingus stulpelius arba pridedant naujus.

tReplace – naudojamas išvalant visus failus prieš tęsiant darbą.

tMap – naudojamas transformuoti duomenis iš vieno arba daugiau šaltinių į vieną arba daugiau krypčių. 

tUniqRow - komponentas užtikrina duomenų kokybę juos įvedant arba išvedant projekto užduotyje.

tMSSqlConnection – MSSQL duomenų bazių komponentas. Atidaro prisijungimą prie duomenų bazės tuometinei transakcijai.

tMySqlConnection - MySQL duomenų bazių komponentas. Atidaro prisijungimą prie duomenų bazės tuometinei transakcijai.

tOracleConnection – Oracle duomenų bazių šeimos komponentas. Naudojamas atidaryti prisijungimą prie specifikuotos duomenų bazės, kuri gali būti pakartotinai panaudotai tolimesnėse pakartotinose projektų užduotyse.

tPostgresqlConnection – atveria prisijungimą prie nurodytos duomenų bazės, kuri gali būti dar kartą panaudotą tolimesnėje projekto užduotyje ar užduotyse.

tFileInputExcel – Perskaito Excel failą, eilutė po eilutės, kad išskirstytų jas laukais, naudojant įprastas išraiškas ir tada išsiunčia laukus tokius, kokie jie aprašyti kito komponento schemoje.

tFileInputJSON – Ištraukia JSON duomenis iš failo ir perkelia duomenis į failą, duomenų bazės lentelę ar pan.

tFileinpuRaw – Perskaito visus duomenis neapdorotame faile ir išsiunčia vieną išeigos stulpelį tolimesniam apdorojimui kitu komponentu.

tFileInputXML – Perskaito XML struktūros failą, eilutė po eilutės, kad išskirtų jas į laukus ir išsiųstų juos tokius, kokie jie aprašyti kito komponento schemoje.

tFileOutputExcel – Parašo MS Excel failą su atskirtomis duomenų reikšmėmis, priklausomai nuo jų aprašymo schemoje.

tFileOutputJSON – Gauna duomenis ir perrašo juos į JSON struktūros duomenų bloką išeities faile.

tFileOutputXML – Parašo XML failą su atskirtomis duomenų reikšmėmis, priklausomai nuo aprašytos schemos.

tFileOutputRaw -Suteikia duomenis, gaunamus iš kito komponento. Duomenys pateikiami vienu stulpeliu.

tFileFetch – ištraukia failą per duotą protokolą (HTTP, HTTPS,  FTP arba SMB).

tRESTClient – sąveikauja su RESTful Web paslaugų tiekėjais, siųsdamas HTTP ir HTTPS užklausas, naudodamas CXF (JAX-RS) gaudamas atitinkamus atsakymus.

tSendMail – Praneša gavėjui apie projekto užduoties būseną arba galimas klaidas.

tSOAP – Iššaukia metodą per Web paslaugas norint išgauti parametro, aprašyto komponento redaktoriuje,  reikšmes.