ledi12

Backend & Data Engineer
Wrocław

2025-03-05 14:56
2019-07-18 20:18
20 532 wizyt

Trójboista, wędkarz, fanatyk słodyczy i taniej dramy. Czasami coś skodze.

Język programowania

Inne

Dev/Ops

Baza danych

PostgreSQL

Framework

Django

Narzędzia

Wpisy ledi12 na mikroblogu

ledi12

2024-11-29 11:40
3461 wyświetleń

Jakiś nowy skam na kredyt we frankach szwajcarskich.

Dzwoni pani z miłym głosem:

Dzień dobry, z tej strony xxx
Dzień dobry
Dzwonię w sprawie zaciągniętego przez Pana kredytu we frankach szwajcarskich
Nie mam takiego kredytu
Do widzenia
XD?

5 głosów Obserwuj Komentuj Udostępnij

Zobacz pozostałe 14 komentarzy

benoni12

do mnie dzwoniła scammerka na Orlen, ale tam chyba mają zakaz rozłączania się, bo 30 min gadała to samo, a ja w sumie też to samo, że przeleje im hajs jak tylko prześlą mi umowę xD

2024-11-30 21:36
0 głosów
Odpowiedz

.GodOfCode.

Jak numer ma 1000 negatywów w internecie to nawet nie odbieram.

2024-11-30 22:17
1 głos
Odpowiedz

ledi12

2024-05-12 22:58
448 wyświetleń

#python #azure

Ostatnio miałem ciekawy problem ci/cd do rozwiązania :P A mianowicie testowanie aplikacji mikroserwisowej w ekosystemie Azure'a przy użyciu cli do lokalnego postawienia funkcji.

Problem był natury wątkowej. Oprócz postawienia serwera funkcji, potrzebowałem również postawić serwer drugiej apki (agregatora danych, fastApi) z którego całość korzysta.

W przypadku azure devops, natywny paraleism działa na poziomie jobów i stage. Wszystkie te byty mogą działać osobno a wymiana danych pomiędzy nimi może polegać chociażby za pomocą artefaktów. Jednak tworzy to kolejny problem a mianowicie budowanie artefaktów, które mają swoje limity, ale nie o tym.

W tym case potrzebowałem trzech osobnych procesów. Jeden odpowiedzialny za postawienie lokalnego cli azure functions. Drugi za odpalenie lokalnego serwer fastApi. Trzeci do egzekucji pytesta.

Do sprawnej komunikacji, wszystko powinno odbyć się w obrębie jednego "taska" po stronie azure devops. Dzięki temu nie trzeba cudować z dodatkową konfiguracją w przypadku np jobów, tak, żeby azure function widziało lokalną wersję fastApi i odwrotnie.

Niestety azure nie posiada "oficjalnego" podejścia w przypadku paraleismu na poziomie pojedyńczego (synchronicznego) taska.

Z pomocą przychodzi import subprocess :) Biblioteka standardowa pozwalająca egzekwować komendy bashowe "pod spodem". Rozwiązaniem okazała się klasa Popen, która jest niczym innym jak nowym procesem. Dodatkowo jest o tyle fajna, że jej wywołanie zwraca adres procesu, którym możemy sterować z wątku nadrzędnego. Możemy go ubić, zatrzymać, czy przerzucić output.

Finalnie rozwiązaniem okazał się prosty moduł testowy (psudo kod):

Kopiuj


fastapi = subprocess.Popen(...)
az_functions = subprocess.Popen(...)
subprocess.run("pytest odpal testy suuuko ;p") # funkcja synchroniczna, która stopuje wątek główny.
fastapi.terminate()
az_functions.terminate()

Następnie po stronie taska w pipeline azure devops, wywoałnie banalnie proste:

Kopiuj

- task: AzureCLI@2
  inputs:
    azureSubscription: sub
    scriptType: 'bash'
    inlineScript: |
      python3.10 nasz_modul.py

Zobacz całość

1 głos Obserwuj Komentuj Udostępnij

ledi12

2024-03-17 13:04
828 wyświetleń

#python #multithreading #ciekawostka

Ostatnio refaktorowałem jeden ze swoich projektów, gdzie kluczowa część jest oparta na wielowątkowości. Tej "wirtualnej" limitowanej przez GIL'a :)
Jak wiadomo, threading.Thread to tak na prawdę dzielenie głównego procesu na mniejsze subprocesy, które współdzielą pamięć (Mogą też zaalokować swoją przy użyciu Thread.local, ale nadal w obrębie wyższej warstwy). Każdy z tych subprocesów działa we własnym zakresie, ale nadal w obrębie głównego procesu, czyli nie ma tutaj mowy o prawdziwym paraellismie pod taski typu cpu-based. Pod I/O jak najbardziej i taki też był mój case. Jest to tzw time-slicing czyli nic innego jako dzielenie czasu procesora i skakanie z jednego "wątku" na drugi.

Mam use cases, gdzie zagnieżdżam jeden "wątek" w drugim. Z początku byłem przekonany, że takie rozwiązanie "przedzieli" istniejący już subprocess na kolejny subprocess, czyli ponownie - Zagnieżdżony wątek będzie zależny od rodzica w którym został zagnieżdżony. Obrazując:

Jak się jednak okazuję, hierarchia "wirtualnych" wątków jest płaska. Oznacza to w praktyce, że bez względu na zagnieżdżanie, czy też nie, każdy nowy "wątek" zawsze będzie tworzony na jednakowym poziomie, czyli nie występuje relacje parent-child pomiędzy zagnieżdżonymi wątkami (Nie wliczając głównego procesu). Finalnie będzie to wyglądać tak:

Prosty test:

Kopiuj

import threading
import time

def child():
    time.sleep(10)
    print("finished child processing")

def parent():
    ch = threading.Thread(target=child)
    ch.start()
    print("finished parent processing")

def main():
    p = threading.Thread(target=parent)
    p.start()
    p.join()
    print("finished main")

if __name__ == "__main__":
    main()

Kopiuj

--> finished parent processing
--> finished main
--> finished child processing

Gdy by zaszła relacja parent--child, to w momencie skończenia procesu parent, child powinien zostać zterminowany a tak nie jest. Oczywiście mógłbym dodać join() na poziomie parent, żeby poczekać na pełną egzekucje child. Anyway powyższe wskazuję, że child w żaden sposób nie jest zależny od parent.

Zobacz całość

1 głos Obserwuj Komentuj Udostępnij

slsy

Czy gdziekolwiek to działa inaczej? W mojej głowie wątki to od zawsze niezależne byty tj. nie ma zależności parent <-> kid. Przypadek dla parent<->kid jest bardzo popularny np. fork-join model, ale to nie oznacza, że reszta nie ma sensu

2024-03-18 10:48
1 głos
Odpowiedz

yarel

A czemu nie async pod ten use-case I/O ?

2024-03-20 09:30
0 głosów
Odpowiedz

ledi12

2024-02-28 14:56
1572 wyświetlenia

#eksperymenty #python

Ostatnio refaktorowałem trochę kodu w pracy. Mamy jeden proces, który regularnie się rozrasta o nowe zależności - Identyfikatory.

Każdy identyfikator jest w postaci oddzielnej klasy.

Żeby dodać nowy identyfikator z nową logiką identyfikacji, trzeba stworzyć nową klasę, zaimportować ją w innym module, wrzucić w tuple, która następnie jest iterowana -> Tworzy obiekt -> wywołuję metodę -> zwraca coś.

Zaczęło mnie to irytować, bo import i tupla regularnie rośnie i jest to taka robota głupiego...

Lubię eksperymentować, więc postanowiłem ubić tego potworka przy pomocy małego "metaprogrammingu" :D

Wjechała nowa abstrakcja:

Kopiuj

class Identifier(ABC):
  @classmethod
  def identify(cls, schema):
        for _cls in cls.__subclassess__():
          if _type := _cls(schema)._identify(): return _type
        return "NotSupportedType"

  @abstractmethod
  def _identify(self, schema) -> Optional[str]:
    pass

Oczywiście każdy z identyfikatorów implementuje swoje własne metody dla konkretnego przypadku. Są one wywoływane we współdzielonym _identify i zwracają co mają zwracać.

Oczywiście są pewne ryzyka w takim podejściu. Wystarczy, że jakiś śmieszek przedziedziczy po którymś z identyfikatorów i nagle subclasses hook zwróci dodatkową klasę :P

Anyway, moduł mocno się skurczył :) Hook wyciąga sobie klasy na podstawie __mro__ dzięki czemu nie trzeba tworzyć dodatkowego importu dla poszczególnych klas (I je gdzieś trzymać jako wsad dla iteratora...).

Zobacz całość

5 głosów Obserwuj Komentuj Udostępnij

Zobacz pozostałe 7 komentarzy

Autysta

@RegalWK: to młody jesteś, ja jak zaczynałem się uczyć C to nie wiedziałem, że istnieje python lub javascript, pythona dopiero mają ze 20 lat zacząłem jakąś książkę czytać do niego.

2024-02-29 14:22
0 głosów
Odpowiedz

Autysta

ALe nudy leti zrobił byś coś ciekawszego

2024-02-29 14:30
0 głosów
Odpowiedz

ledi12

2024-02-20 20:50
8306 wyświetleń

#pandas #python #dane

Fun fakt jak detale potrafią zabrać mnóstwo czasu a zarazem popchnąć w over-engineering.

Stakeholderzy zaczeli zgłaszać, że call do naszego api, z konkretną listą parametrów, zwraca wyniki za późno. Max czas do zaakceptowania to 20 sec, gdyż po tym właśnie czasie ichniejszy system rzuca timeoutem. Zwrotka zajmowała natomiast 30 sekund.

Api to taki ogromny agregat wypluwający dane telemetryczne, bazujący w głównej mierze na pandasie. Po debugu okazało się, że winowajcą jest jedna linia, która tworzy pivota na dużym zbiorze danych.

I tutaj zaczęły się cyrki. Ludzie chcieli już ograniczać dane, bo: "TO WINA DANYCH" albo przepisywać ten moment przy użyciu multiprocesingu (Chunkowanie df na mniejsze i pivotowanie tego paraell a na końcu iteracyjne mergowanie wszystkiego w całość). No niby można, ale po co?

Z tyłu głowy miałem, że pandas (tak jak spark z resztą) z automatu narzuca typ float64 w przypadku wartości numerycznych. Precyzja w przypadku tych danych jest mała, więc float32 zrobił by robotę i podniósł ogólną wydajność. Szybki test i jak się okazało miałem racje. Czas spadł z 30 sekund do 8 :)

Mały detal a zaoszczędził reszcie x dni krwawicy i cudowania jak koń pod górkę :P Niekiedy diabeł po prostu tkwi w szczegółach.

18 głosów Obserwuj Komentuj Udostępnij

Zobacz pozostałe 23 komentarze

lion137

@ledi12: trochę przypał, że ktoś nie popaczal na typy na początku

2024-02-25 20:14
0 głosów
Odpowiedz

lion137

@ToTomki: Utrzymuję dwa projekty pytonowe, jeden mój i jeden rozwinięty, i śmigają już od roku, pisane funkcyjno - proceduralnie.

2024-02-27 17:43
1 głos
Odpowiedz

ledi12

2024-01-27 15:51
13821 wyświetleń

Ostatnio eksperymentuje sobie z pythonowym typowaniem.
W przypadku pythona jestem fanem podejścia funkcyjnego a sam język dostarcza multum narzędzi do tego typu zabawa (Bogate moduły dostarczające mechanizmy aka higher order functions).

Jestem też fanem sensownego typowania które dostarcza chociażby TS i takowe też próbowałem odzwierciedlić w pythonie w przypadku funkcji tworzonych w locie. Jak się okazało, można uzyskać bardzo podobny efekt przy użyciu takich klas jak TypedDict oraz Protocol.

TypedDict to nic innego jak typowana relacja klucz-wartość. Natomiast Protocol to taka pythonowa wersja interfejsu.

Z zasady, w pythonie wszystko jest obiektem i każdy z tych obiektów jako meta class dziedziczy po type. Kolejno, bazowa definicja type dostarcza z automatu definicje metody magicznej __call__, która to określa, czy obiekt jest callable a więc, czy jest może działać jako funkcja.

Przykładowy (bardzo ogólny) kod:

Kopiuj

class Brands(Enum):
    MERCEDES = "mercedes"

class Car(NamedTuple):
    brand: Brands
    model: str

def drive_car(car: Car, broken: bool = False) -> None:
    if not broken:
        print(f"I'm driving {car.brand.value} {car.model}")
        return
    print(f"This {car.brand.value} is broken :(")

if __name__ == "__main__":

    mercedes_amg = Car(Brands.MERCEDES, "amg")

    drive_mercedes_amg = partial(drive_car, car=mercedes_amg)
    drive_broken_mercedes_amg = partial(drive_mercedes_amg, broken=True)

No dobra, stworzyliśmy dwie nowe funkcje "w locie", ale jakiego typowania użyć? Teoretycznie typing dostarcza typ Callable określający funkcje i to było by teoretycznie okej. Limitacją takiego podejścia jest fakt, że definiujemy tam jedynie typ argumenty, pomijając jego nazwę. W przypadku obiektów, które potrzebują wiele argumentów, takie podejście może wprowadzić pewien chaos.

Na szczęście mając na uwadze fakt istnienia Protocol i __call__ i TypedDict, możemy zrobić pewien sprytny fikołek i uzyskać oczekiwany efekt.

Kopiuj

class Brands(Enum):
    MERCEDES = "mercedes"

class Car(NamedTuple):
    brand: Brands
    model: str

class _DriveCarBase(TypedDict):
    car: Car

class DriveCarFunc(Protocol):
    def __call__(self, **car_base: _DriveCarBase) -> Any:
        pass

class DriveBrokenCarFunc(Protocol):
    def __call__(self, broken: bool = True, **car_base: _DriveCarBase) -> Any:
        pass

def drive_car(car: Car, broken: bool = False) -> None:
    if not broken:
        print(f"I'm driving {car.brand.value} {car.model}")
        return
    print(f"This {car.brand.value} is broken :(")

if __name__ == "__main__":

    mercedes_amg = Car(Brands.MERCEDES, "amg")

    drive_mercedes_amg: DriveCarFunc = partial(drive_car, car=mercedes_amg)
    drive_broken_mercedes_amg: DriveBrokenCarFunc = partial(drive_mercedes_amg, broken=True)

Mimo, że z założenia python jest dynamiczny pod względem typowania, to jednak samo typowanie ciągle ewoluuje i dostarcza co raz to nowszych funkcjonalności. Powoli skręca w kierunku TS co w mojej ocenie jest czymś pozytywnym. W wersji 3.12 zaimplementowano mechanizm obsługi json na wzór tego z js czyli bezpośrednie wywołanie atrybutu (obiekt.atrybut). Istniało to oczywiście wcześniej, ale trzeba było instalować 3rd party lib, natomiast teraz mamy to w standardzie :)

Zobacz całość

6 głosów Obserwuj Komentuj Udostępnij

Zobacz pozostałe 7 komentarzy

Saalin

Nie ma jednej, lepszej składni, czepianie się syntaxu Pythona to jak przywalanie się do Lispa, że za dużo nawiasów jest albo do Haskella, że call funkcji to f x a nie f(x).

2024-01-29 10:40
1 głos
Odpowiedz

LitwinWileński

to już lepiej na kotlin przepisać, będzie śmigać 200 razy szybciej.

2024-01-29 20:39
0 głosów
Odpowiedz

Poznaj

Szukaj pracy

Najlepsze oferty na rynku IT

AI/ML Engineer | AI-Augmented Developer | Libraxis AI

Libraxis AI Warsaw (100% pracy zdalnej)

9 000 - 21 000 zł

pytorch
tensorflow
mlx

Senior Full-Stack Developer (Audit & Architecture)

Libraxis AI Warsaw (100% pracy zdalnej)

22 400 - 27 200 zł

rest
graphql
python

Senior Full-Stack Developer | Libraxis AI

Libraxis AI Warsaw (100% pracy zdalnej)

12 000 - 24 000 zł

react
typescript
next.js

Więcej ofert pracy

Aktywność

5 pkt za Ocena postu

2025-03-05 16:02

Ale to nie ma najmniejszego znaczenia. Kontrahent i tak może przestać ci płacić mimo...

5 pkt za Ocena postu

2025-03-05 12:55

Ale to nie ma najmniejszego znaczenia. Kontrahent i tak może przestać ci płacić mimo...

5 pkt za Ocena postu

2025-03-05 12:55

No i w tym momencie sami nie wywiązują się z umowy nie płacąc Ci na czas za co równi...

5 pkt za Ocena postu

2025-03-05 12:38

Przypominam, że prawo cywilne to nadal prawo. To, że klient sobie coś tam rości tylk...

5 pkt za Ocena postu

2025-03-05 12:22

Przypominam, że prawo cywilne to nadal prawo. To, że klient sobie coś tam rości tylk...

5 pkt za Ocena postu

2025-03-05 10:36

somekind napisał(a): Mariuszpe napisał(a): Jakoś mniej więcej od covidu mam wrażenie...

5 pkt za Ocena postu

2025-03-04 17:57

somekind napisał(a): Mariuszpe napisał(a): Jakoś mniej więcej od covidu mam wrażenie...

5 pkt za Ocena postu

2025-03-03 22:30

CoderOne napisał(a): Po co komu junior skoro AI klepie kod na poziomie mida? Za 5 la...

5 pkt za Ocena postu

2025-03-03 14:52

Można pobrać wiele plików na raz i jest do tego dedykowane sdk. https://learn.micros...

5 pkt za Ocena postu

2025-03-03 13:47

somekind napisał(a): Mariuszpe napisał(a): Jakoś mniej więcej od covidu mam wrażenie...

Historia reputacji

29657 pkt

Uprawnienia

1

użycie chińskich znaków w tekście
10

używanie wspomnień użytkowników
50

oddawanie głosów na wpisy innych
50

publikacja URL do strony WWW w profilu
50

dodanie URL do strony WWW w sygnaturze na forum
300

dodawanie nowych tagów
1000

publikacja wątków z krótkim tytułem
10000

brak reklam banerowych oraz na mikroblogu
10000

edycja własnych postów do 1 miesiąca od daty napisania

Sprawdź czym są punkty reputacji i jak możesz je zdobyć

ledi12

Backend & Data Engineer

Wpisy ledi12 na mikroblogu

ledi12

ledi12

ledi12

ledi12

ledi12

ledi12

Poznaj

Szukaj pracy

AI/ML Engineer | AI-Augmented Developer | Libraxis AI

Senior Full-Stack Developer (Audit & Architecture)

Senior Full-Stack Developer | Libraxis AI

Aktywność

Historia reputacji

Uprawnienia

Praca dla programistów

Forum dyskusyjne

Sprawy administracyjne

O nas

Skontaktuj się z nami