Praca jako ETL developer - hurtownie danych

Praca jako ETL developer - hurtownie danych
MC
  • Rejestracja:ponad 6 lat
  • Ostatnio:ponad 5 lat
  • Postów:21
0

Czy pracuje ktoś z was jako ETL developer / Informatica Powercenter Developer lub ogólnie w środowisku związanym z szeroko pojętymi hurtowniami danych - Szczególnie tam gdzie używa się narzędzia Informatica Powercenter?

Na polskich forach stosunkowo mało jest informacji na ten temat i mam wrażenie, że to dużo mniej popularna działka niż zostanie programistą java czy innego popularnego języka, a stawki są na prawdę wysokie - szczególnie tam gdzie wymagana jest znajomość Informatica Powercenter.

Rozważam pokierowanie swojej ścieżki kariery właśnie w tę stronę. Obecnie pracuje przy wdrożeniach systemów CRM jako konsultant (produkty SAPowe). Dobrze ogarniam SQL oraz relacyjne bazy danych oraz trochę teorie jeśli chodzi o hurtownie danych (środowisko Oraclowe), ale wydaje mi się, że to może być za mało.
Raczej nie spotykam ofert na juniorów, a jeśli już jakieś są to wymagają przynajmniej pół roku doświadczenia z procesami ETL. Zresztą samych ofert dla ETLowców poza Warszawą raczej nie spotykam

Co myślicie o takiej ścieżce kariery? Czy w dobie Big Data i przenoszenia danych w chmure jest to przyszłościowy kierunek? Czego warto pouczyć się w domu jeśli chciałbym rozwijać się w tym kierunku (oprócz SQL i teorii co do baz danych i procesów ETL - widziałem kilka kursów również na udemy) i czy bez doświadczenia typowo komercyjnego z procesami ETL jest szansa na dostanie się gdziekolwiek jako junior.
Szukałem jakieś wersji Informatica Powercenter i jest do korzystania przez 30 dni - ale nie wiem czy taka nauka w domu będzie cokolwiek warta

Julian_
  • Rejestracja:prawie 8 lat
  • Ostatnio:ponad 4 lata
  • Postów:1703
0
kate87
What? No Ty jak srzelisz to po prostu klekajcie narody.
Julian_
dałem linka na poparcie tego co napisałem. Bardzo dobra znajomość i umiejętność korzystania z programów MS-Office (Szczególnie MS ACCESS)
C6
  • Rejestracja:około 11 lat
  • Ostatnio:około 17 godzin
  • Postów:197
2

Osobiście zajmuję się BI / DWH (Oraclowy stack i teraz douczam się Oracle Data Integrator żeby przenosić się bardziej na ETL).

Patrząc na oferty związane z DWH / ETL najwięcej ofert jest dla technologii Microsoftu oraz właśnie Informatica (IPC).
Jeżeli chcesz szukać materiałów, odrzuć Polskie strony. Hurtownie i BI nie jest jeszcze aż tak popularny w Polsce (chociaż jak pracuję myślę, że jest coraz większy angaż na rynku, plus dochodzi 'Big Data' którą się wplata). Najwięcej informacji znajdziesz na różnych blogach, YT, kursy zdarzają się (udemy). Raczej nie ma konferencji w Polsce poświęconych stricte Hurtowniom Danych. Osobne szkolenia na które warto by było się wybrać a nie kosztują majątku również są rzadko i należałoby szukać na stronach firm, które czasami prowadzą webinary/szkolenia/artykuły.

Podstawa do SQL i znajomość baz. Zarówno w dziale samego BI jak i głębiej czyli Hurtownie i ETL znajomośc języka bazodanowego pomaga, często się tego wymaga. Wartość znać język np. PL/SQL czy T/SQL. Odnośnie części merytorycznej dla DWH nie jestem zwolennikiem teorii a praktyki, jednak są pozycję które warto przeczytać - książki Kimballa.

Odnośnie ofert pracy zauważyłem, że jest dużo ale na kontraktach - przeważnie w Warszawie lub dla klientów zagranicznych (outsourcing). Stawki są jak dla mnie wysoki, w porównaniu z programistycznymi również uważam że są wysokie - ale głównie dlatego że to są kontrakty.
Jako, że jest BUM na dane, big date itp tworząc ETL również wykorzystuję się już powoli Hadoop i technologie z nim związane, dlatego warto znać bazy danych, hurtownie ale również zagłębić się jak działa Hadoop itp.

Osobiście ucząc się ODI, nie mając jeszcze możliwości pracy nad komercyjnymi projektami, tworzę swoję. Oracle udostępnia środowiska sample i prostą baze danych. Samodzielnie również możesz wszystko skonfigurować czyli postać sobie prostę baze danych z danymi lub dane wsadowe z Excel i podepnij to z Informaticą i jakieś proste transformację możesz wykonywać.

GJ
  • Rejestracja:ponad 8 lat
  • Ostatnio:ponad rok
  • Postów:75
1

W zasadzie @choracy69 wyczerpał temat. Najpopularniejsza jest Informatica Power Center, mniej popularny jest np. IBM Data Stage, bardzo niszowe (i są tam najwyższe chyba stawki) jest Ab Initio. Darmowe jest chyba Pentaho (polecam ściągnąć).

Trudno się ETL-a nauczyć w domu samemu, a na pewno nie w 30 dni, uczysz się raczej na projekcie tzn. trudno żebyś w domu postawił klaster z 1 TB danych do przeładowania, sześć baz :-) i instancję Powercenter, to są technologie ściśle korporacyjne.
Moim zdaniem warto uczyć się języka bazodanowego np. Oracle PL/SQL (ale także np. Teradaty), a potem naturalną ścieżką "rozszerzyć się" o jakiegoś ETL-a. Znałem kilku deweloperów Oracle, którzy zmigrowali się po kilku latach pracy do Powercenter.

MC
  • Rejestracja:ponad 6 lat
  • Ostatnio:ponad 5 lat
  • Postów:21
0

A spotkaliście się z jakimiś stanowiskami juniorskimi dla kogoś kto zna relacyjne bazy danych i PL/SQL,a pracodawca oferuje naukę narzędzi typu Informatica Powercenter czy raczej wszędzie szukają ludzi, którzy w bazach danych siedzą już długo?

Jak wyglądała wasza ścieżka kariery?

IA
Accenture, SAS, Asseco. od praktyk, juniorow po ekspertow
C6
  • Rejestracja:około 11 lat
  • Ostatnio:około 17 godzin
  • Postów:197
0
mam_Cie napisał(a):

A spotkaliście się z jakimiś stanowiskami juniorskimi dla kogoś kto zna relacyjne bazy danych i PL/SQL,a pracodawca oferuje naukę narzędzi typu Informatica Powercenter czy raczej wszędzie szukają ludzi, którzy w bazach danych siedzą już długo?

Jak wyglądała wasza ścieżka kariery?

Pozycje juniorskie jako tako raczej są rzadko spotykane. Bardziej można znaleźć juniorskie związane z raportowanie/business intelligence. Ja osobiście tak zaczynałem BI i powoli staram się poszerzać zakres pracy jak i technologie.

Wydaje mi się, że jeżeli znasz bazy danych (Oracle), umiesz SQL, PL/SQL i masz wstępne pojęcie o hurtowniach i procesach ETL to możesz próbować wysłać CV podkreślając, że Informatica znasz podstawy lub się douczysz. Czasami pracodawcy / klienci oferują douczenia się technologii (miesiąc wdrożenia) lub podpytać rekruterów / headhunterów na jakie pozycje szukają i czy jest możliwość douczenia.

mariano901229
  • Rejestracja:ponad 10 lat
  • Ostatnio:6 miesięcy
  • Postów:597
0

Podepnę się do tematu. Czy w pracy jako ETL Developer, programista hurtownii jak zwał tak zwał zdarza się wam wykorzystywać efektywnie jakieś metody eksploracji danych typu reguły asocjacyjne, klasyfikacje, grupowania ? Czy projekty typowo komercyjne to tylko generowanie jakiś raportów w SSRS, Excelu dla zarządzających itp. ? Pytam z ciekawości ponieważ zajmowałem się hurtowniami i metodami eksploracji danych hobbystycznie, raz w swojej karierze miałem do czynienia z komercyjnym produktem, ale to raczej był słaby projekt (może nie słaby pod względem złożoności problemu, ale jego wykonania).

C6
  • Rejestracja:około 11 lat
  • Ostatnio:około 17 godzin
  • Postów:197
1
mariano901229 napisał(a):

Podepnę się do tematu. Czy w pracy jako ETL Developer, programista hurtownii jak zwał tak zwał zdarza się wam wykorzystywać efektywnie jakieś metody eksploracji danych typu reguły asocjacyjne, klasyfikacje, grupowania ? Czy projekty typowo komercyjne to tylko generowanie jakiś raportów w SSRS, Excelu dla zarządzających itp. ? Pytam z ciekawości ponieważ zajmowałem się hurtowniami i metodami eksploracji danych hobbystycznie, raz w swojej karierze miałem do czynienia z komercyjnym produktem, ale to raczej był słaby projekt (może nie słaby pod względem złożoności problemu, ale jego wykonania).

Należy tutaj rozdzielić dwie sprawy: ETL Develoepr w 90% nie zajmuje się generowanie raportów. ETL Developer zajmuję się przede wszystkim pozyskiwaniem danych - dane z różnych systemów integruje i tworzy odpowiednie wymiary/fakty na hurtowni - tak można to ewentualnie opisać. Czy wykorzystują jakieś konkretne metody eksploracji danych to do końca nie znam odpowiedzi - wydaje mi się, że tak. Natomiast samym raportowaniem/wizualizacją oraz tworzenie już struktury w hurtowni zajmują się bardziej BI Developerzy. Oczywiście te dwie pozycję mogą się pokrywać w zależności od firmy lub są pozycję BI/DWH Developer na przykład - ja taką mam na drugim kontrakcie gdzie dostanę obszar jaki mam zrobić i robię wszystko od procesów ETL po wizualizację w BI.

Same projekty do nie tylko dla 'zarządzających'. W mojej krótkie karierze oczywiście zdarzyły się kokpity menadżerskiej dla dyrektorów, ale również wszelakie zestawienia statystyczne, wykonywania paczek/procedur/programów współbieżnych po zestawienia z działów czy produkcji ale również technologie Write Back gdzie odpowiednie osoby mogły edytować dane, sprawy administracji i dostepów (można było na kokpicie nadawać uprawnienia), generowanie mapek w BI itp. Często analizy w BI pomagały np. developerom czy analitykom podglądać swoją pracę/godziny/zestawienia.
Jednak warto zaznaczyć, że zwykli użytkownicy rzadko mają możliwość korzystania z BI - raczej są to jacyś liderzy, brygadziści, szefowie, dyrektorowie.

edytowany 1x, ostatnio: choracy69
Kliknij, aby dodać treść...

Pomoc 1.18.8

Typografia

Edytor obsługuje składnie Markdown, w której pojedynczy akcent *kursywa* oraz _kursywa_ to pochylenie. Z kolei podwójny akcent **pogrubienie** oraz __pogrubienie__ to pogrubienie. Dodanie znaczników ~~strike~~ to przekreślenie.

Możesz dodać formatowanie komendami , , oraz .

Ponieważ dekoracja podkreślenia jest przeznaczona na linki, markdown nie zawiera specjalnej składni dla podkreślenia. Dlatego by dodać podkreślenie, użyj <u>underline</u>.

Komendy formatujące reagują na skróty klawiszowe: Ctrl+B, Ctrl+I, Ctrl+U oraz Ctrl+S.

Linki

By dodać link w edytorze użyj komendy lub użyj składni [title](link). URL umieszczony w linku lub nawet URL umieszczony bezpośrednio w tekście będzie aktywny i klikalny.

Jeżeli chcesz, możesz samodzielnie dodać link: <a href="link">title</a>.

Wewnętrzne odnośniki

Możesz umieścić odnośnik do wewnętrznej podstrony, używając następującej składni: [[Delphi/Kompendium]] lub [[Delphi/Kompendium|kliknij, aby przejść do kompendium]]. Odnośniki mogą prowadzić do Forum 4programmers.net lub np. do Kompendium.

Wspomnienia użytkowników

By wspomnieć użytkownika forum, wpisz w formularzu znak @. Zobaczysz okienko samouzupełniające nazwy użytkowników. Samouzupełnienie dobierze odpowiedni format wspomnienia, zależnie od tego czy w nazwie użytkownika znajduje się spacja.

Znaczniki HTML

Dozwolone jest używanie niektórych znaczników HTML: <a>, <b>, <i>, <kbd>, <del>, <strong>, <dfn>, <pre>, <blockquote>, <hr/>, <sub>, <sup> oraz <img/>.

Skróty klawiszowe

Dodaj kombinację klawiszy komendą notacji klawiszy lub skrótem klawiszowym Alt+K.

Reprezentuj kombinacje klawiszowe używając taga <kbd>. Oddziel od siebie klawisze znakiem plus, np <kbd>Alt+Tab</kbd>.

Indeks górny oraz dolny

Przykład: wpisując H<sub>2</sub>O i m<sup>2</sup> otrzymasz: H2O i m2.

Składnia Tex

By precyzyjnie wyrazić działanie matematyczne, użyj składni Tex.

<tex>arcctg(x) = argtan(\frac{1}{x}) = arcsin(\frac{1}{\sqrt{1+x^2}})</tex>

Kod źródłowy

Krótkie fragmenty kodu

Wszelkie jednolinijkowe instrukcje języka programowania powinny być zawarte pomiędzy obróconymi apostrofami: `kod instrukcji` lub ``console.log(`string`);``.

Kod wielolinijkowy

Dodaj fragment kodu komendą . Fragmenty kodu zajmujące całą lub więcej linijek powinny być umieszczone w wielolinijkowym fragmencie kodu. Znaczniki ``` lub ~~~ umożliwiają kolorowanie różnych języków programowania. Możemy nadać nazwę języka programowania używając auto-uzupełnienia, kod został pokolorowany używając konkretnych ustawień kolorowania składni:

```javascript
document.write('Hello World');
```

Możesz zaznaczyć również już wklejony kod w edytorze, i użyć komendy  by zamienić go w kod. Użyj kombinacji Ctrl+`, by dodać fragment kodu bez oznaczników języka.

Tabelki

Dodaj przykładową tabelkę używając komendy . Przykładowa tabelka składa się z dwóch kolumn, nagłówka i jednego wiersza.

Wygeneruj tabelkę na podstawie szablonu. Oddziel komórki separatorem ; lub |, a następnie zaznacz szablonu.

nazwisko;dziedzina;odkrycie
Pitagoras;mathematics;Pythagorean Theorem
Albert Einstein;physics;General Relativity
Marie Curie, Pierre Curie;chemistry;Radium, Polonium

Użyj komendy by zamienić zaznaczony szablon na tabelkę Markdown.

Lista uporządkowana i nieuporządkowana

Możliwe jest tworzenie listy numerowanych oraz wypunktowanych. Wystarczy, że pierwszym znakiem linii będzie * lub - dla listy nieuporządkowanej oraz 1. dla listy uporządkowanej.

Użyj komendy by dodać listę uporządkowaną.

1. Lista numerowana
2. Lista numerowana

Użyj komendy by dodać listę nieuporządkowaną.

* Lista wypunktowana
* Lista wypunktowana
** Lista wypunktowana (drugi poziom)

Składnia Markdown

Edytor obsługuje składnię Markdown, która składa się ze znaków specjalnych. Dostępne komendy, jak formatowanie , dodanie tabelki lub fragmentu kodu są w pewnym sensie świadome otaczającej jej składni, i postarają się unikać uszkodzenia jej.

Dla przykładu, używając tylko dostępnych komend, nie możemy dodać formatowania pogrubienia do kodu wielolinijkowego, albo dodać listy do tabelki - mogłoby to doprowadzić do uszkodzenia składni.

W pewnych odosobnionych przypadkach brak nowej linii przed elementami markdown również mógłby uszkodzić składnie, dlatego edytor dodaje brakujące nowe linie. Dla przykładu, dodanie formatowania pochylenia zaraz po tabelce, mogłoby zostać błędne zinterpretowane, więc edytor doda oddzielającą nową linię pomiędzy tabelką, a pochyleniem.

Skróty klawiszowe

Skróty formatujące, kiedy w edytorze znajduje się pojedynczy kursor, wstawiają sformatowany tekst przykładowy. Jeśli w edytorze znajduje się zaznaczenie (słowo, linijka, paragraf), wtedy zaznaczenie zostaje sformatowane.

  • Ctrl+B - dodaj pogrubienie lub pogrub zaznaczenie
  • Ctrl+I - dodaj pochylenie lub pochyl zaznaczenie
  • Ctrl+U - dodaj podkreślenie lub podkreśl zaznaczenie
  • Ctrl+S - dodaj przekreślenie lub przekreśl zaznaczenie

Notacja Klawiszy

  • Alt+K - dodaj notację klawiszy

Fragment kodu bez oznacznika

  • Alt+C - dodaj pusty fragment kodu

Skróty operujące na kodzie i linijkach:

  • Alt+L - zaznaczenie całej linii
  • Alt+, Alt+ - przeniesienie linijki w której znajduje się kursor w górę/dół.
  • Tab/⌘+] - dodaj wcięcie (wcięcie w prawo)
  • Shit+Tab/⌘+[ - usunięcie wcięcia (wycięcie w lewo)

Dodawanie postów:

  • Ctrl+Enter - dodaj post
  • ⌘+Enter - dodaj post (MacOS)