Wpisy z tagiem: database

Tagi popularne na mikroblogu

programowanie × 852
off-topic × 557
autopromocja × 389
links × 234
4programmers.net × 233
koziolekweb × 230
blog × 188
coyote × 173
praca × 173
lazarus × 150

Spearhead

2024-09-15 21:37
472 wyświetlenia

W ramach zabawy z domowym projektem w Pythonie stawiam sobie dla niego bazkę na MySQL-u. W sumie to nie miałem okazji dłubać przy RDBMS-ach od dłuższego czasu i chyba nie było za czym tęsknić.

Mam sobie tabelkę (uproszczoną) do trzymania tagów:

Kopiuj

CREATE TABLE Tags (
    TagID TINYINT UNSIGNED NOT NULL AUTO_INCREMENT,
    Name VARCHAR(32),
    PRIMARY KEY (TagID),
    UNIQUE(Name)
);

I teraz chcę sobie zaimplementować mechanizm "wstaw jeśli nie istnieje, zwróć aplikacji jego id". Można by to rozdzielić na dwa osobne zapytania, ale to biedne strasznie, więc sprawdźmy najpierw gołe INSERT IGNORE.

Kopiuj

cursor.execute(
    """INSERT IGNORE INTO Tags(Name) VALUES(%s)""",
    ("Test",)
)
conn.commit()
print(cursor.lastrowid)

No i niestety źle, bo lastrowid jest uzupełniany tylko jeśli coś rzeczywiście wstawimy, jeżeli natomiast dany tag już istnieje to otrzymana wartość będzie 0. Nie oto chodzi.

Internet podsuwa inne rozwiązanie. Używamy ON DUPLICATE KEY i ustawiamy sobie ID następująco:

Kopiuj

cursor.execute(
    """INSERT INTO Tags(Name) VALUES(%s) ON DUPLICATE KEY UPDATE TagID=LAST_INSERT_ID(TagID)""",
    ("Test",)
)
conn.commit()
print(cursor.lastrowid)

I teraz już działa - jak wstawiamy do tabeli to dostajemy ostatni id, a jak mamy duplikat, to również dostajemy jak trzeba. Pieknie.

No ale pojawia się kolejny problem, ponieważ AUTO_INCREMENT odpala się za każdym razem jak to wywołujemy, czy wstawimy czy nie. Parokrotna próba wstawienia duplikatu nabija licznik, a że TINYINT UNSIGNED to nędzny zakres 0-255 (ustawiłem mały bo ja nie mam dużo tagów), więc się wyczerpał w mgnieniu oka. Co teraz?

Jedna z opcji mówi, że po prostu należy dziurami między idkami powiększając zakres zmiennej. Najprościej. Bajty są tanie. Tym niemniej, mam garść tagów, wstawianie nowych będzie esktremalnie rzadkie, usuwane najprawdopodobniej nie będą nigdy, za to będę miał miliony testów na duplikację do przeprowadzenia. Te wszystkie ID-ki mi mogą mocno spuchnąć. I pewnego dnia może się okazać, że wylazłem poza zakres. Jakoś tak wolałbym mieć gęstsze upakowanie tych wartości.

Można by przenieść zarządzanie idk-ami piętro wyżej, do samej aplikacji. Do zrobienia, ale... serio...? Po to mam bazę bym się nie musiał babrać z takimi rzeczami.

Internet mówi, że można zmodyfikować zmienną innodb_autoinc_lock_mode w configu serwera, która zmienia to zachowanie kosztem spadku wydajności. Trzeba to wrzucić do /etc/mysql/conf.d/mysql.cnf.

Kopiuj

[mysqld]
innodb_autoinc_lock_mode = 0

Można sprawdzić wartość takiej opcji tak:

Kopiuj

mysql> SELECT @@innodb_autoinc_lock_mode;
+----------------------------+
| @@innodb_autoinc_lock_mode |
+----------------------------+
|                          0 |
+----------------------------+

W rezultacie dziury w id-ach się już nie tworzą - niestety, wyłącznie w ramach stosowania INSERT IGNORE. Podejście z ON DUPLICATE KEY UPDATE już dziury robi. Jako że potrzebuję by zwracać ostatni id, więc podejście to też się nie sprawdza.

Grzebiąc dalej po necie natykam się na wypowiedz na Stacku, gdzie kolo mówi po prostu, że nie należy tak ufać AUTO_INCREMENT. Ma ono gwarantować aby kolejne idki rosły i nic poza tym, jeżeli chce się je "zagęścić", to trzeba podejść do tego inaczej. Wygląda na to, że inni ludzie również się wyburaczają o ten sam mechanizm.

To se pomyślałem "a może trigger...?". No to sprawdźmy. Najpierw zdjąłem ze schemy AUTO_INCREMENT po czym wstawiłem trigger:

Kopiuj

CREATE TRIGGER UpdateID BEFORE INSERT ON Tags
FOR EACH ROW SET NEW.TagID = (SELECT COALESCE(MAX(TagID), 0) + 1 FROM Tags);

I to cudo faktycznie ręcznie uzupełnia ID bez żadnej dziury. Trzeba tylko wywołać INSERT INTO z wartością 0 dla TagID (bo i tak trigger ją zamieni) i niezależnie czy operacja się udała (bo nie było jeszcze takiego tagu) czy nie (bo duplikat) nie ma żadnego puchnięcia. Jak dodaję unikalną wartość to zawsze będzie miała ID-ek o jeden większy.

Tyle że jak to teraz wywołam z Pythonie:

Kopiuj

cursor.execute(
    """INSERT INTO Tags(TagID, Name) VALUES(%s, %s) ON DUPLICATE KEY UPDATE TagID=LAST_INSERT_ID(TagID)""",
    (0, "Drive",)
)
conn.commit()
print(cursor.lastrowid)

To efekt jest dokładnie na odwrót jak na samym początku, jak sprawdzałem gołe INSERT IGNORE. Wtedy jak coś wstawiłem to dostawałem nowy idek, a jak miałem duplikat to dostawałem zero. Teraz jeśli wstawiłem element to zwraca mi 0 (bo taka wartość została użyta, a o triggerze tu nie wiadomo), a jeśli mam duplikat to dostaję poprawny id.

Aaaale. Co się okazuje. Jak użyłem takiego samego triggera ale zostawiłem w schemie AUTO_INCREMENT to nagle działa tak jak chciałem. Kod Pythona, już bez jawnego wstawiania TagID:

Kopiuj

cursor.execute(
    """INSERT INTO Tags(Name) VALUES(%s) ON DUPLICATE KEY UPDATE TagID=LAST_INSERT_ID(TagID)""",
    ("Test",)
)
conn.commit()
print(cursor.lastrowid)

Zwraca nowy id dla nowych elementów i poprawny id dla duplikatów. Hę...? Może czegoś nie widzę, ale na oko ~~babka umarła~~ wszystko wydaje się zasuwać jak trzeba. No dobra, niech i tak zostanie. Aplikowana stomatologia hipologiczna.

A tak w ogóle to wszystko przy założeniu, że nie ma wstawiania grupowego które to zagadnienie dodatkowo komplikuje całe zagadnienie.

Important
If you insert multiple rows using a single INSERT statement, LAST_INSERT_ID() returns the value generated for the first inserted row only. The reason for this is to make it possible to reproduce easily the same INSERT statement against some other server.

Tak że dla moich tagów to nie problem, ale jak widać moje zabawy nie wyczerpują tematu. Aczkolwiek chyba wystarczy mi tłuczenia się z bazą na jeden dzień.

Zobacz całość

1 głos Obserwuj Komentuj Udostępnij

Dregorio

Dobra, może ja czegoś nie widzę, ale dlaczego nie zrobiłeś funkcji?

2024-09-16 07:06
0 głosów
Odpowiedz

Spearhead

@Dregorio: bo to co napisałem zadziałało, więc już więcej nie kombinowałem.

2024-09-16 23:45
0 głosów
Odpowiedz

not Michal

2024-01-24 15:05
5554 wyświetlenia

Prosty jak budowa cepa RBAC (Role Based Access Control) w Supabase

Ostatnio pracowałem nad side project na Supabase i musiałem zaimplementować RBAC. Moje rozwiązanie okazało się na tyle interesujące, że zyskało uznanie samego Supabase i znalazło się w ich community highlights!

Kluczowe w moim podejściu było wykorzystanie bogatego zestawu narzędzi, które oferuje PostgreSQL. Okazało się, że całą kontrolę dostępu opartą na rolach można skutecznie zrealizować bezpośrednio na poziomie bazy danych. Jeśli jesteś ciekaw szczegółów, zapraszam do przeczytania mojego artykułu tutaj https://devstuffs.substack.com/p/dead-simple-role-based-access-control.

14 głosów Obserwuj Komentuj Udostępnij

PaulGilbert

Pojęcia nie mam co to Supabase, ale to co napisałeś brzmi, spoko, więc daję lajka :-D

2024-01-25 14:11
1 głos
Odpowiedz

Schadoow

@PaulGilbert: Taka alternatywa do firebasa od googla :v. A tak całkiem serio tworzysz baze i na podstawie schemy masz z automatu cruda + authN/Z w paczce więc mechanizmami bazodanowymi możesz opendzlować temat autoryzacji do konkretnych zasobów np masz dostęp jaki uzytkownik robi request HTTP albo graphql (który tłumaczony jest do zapytania) a ty na poziomie RLS robisz walidacje czy uzytkownik X może wykonać operacje na wierszu Y. Można powiedzieć taka platforma low-code.

2024-02-04 17:53
0 głosów
Odpowiedz

elszczepano

2023-10-15 13:43
713 wyświetleń

Twoja baza SQL jest zbyt duża? Szukasz miejsc do optymalizacji rozmiaru bazy? A być może któraś z tabel puchnie i nie wiesz która?

Istnieje prosty sposób, by poznać rozmiar tabel w MySQL. Poniżej przedstawiam proste rozwiązanie pozwalające sprawdzić rozmiary tabel w bazie danych. Nie zawsze istnieje możliwość skorzystania z interfejsu graficznego, a przy dużej liczbie tabel i on może być zawodny.

Kod dostępny również w formie Gist-a: https://gist.github.com/elszczepano/e56a164c6703966aa2a3318ced677123.

Get size of particular tables in MySQL database

Get size of particular tables in MySQL database. GitHub Gist: instantly share code, notes, and snippets.

https://gist.github.com/elszczepano/e56a164c6703966aa2a3318ced677123

1 głos Obserwuj Komentuj Udostępnij

woolfik

2023-09-29 09:13
2693 wyświetlenia

Witajcie,

Nie wiem z czego korzystacie jeśli chodzi o narzędzia do baz danych. Ja przynajmniej do oracle korzystałem z wielu narzędzi każde ma swoje plusy i minusy. Toad moim zdaniem ma wszystko czego potrzebujecie ale cena jest mocno zaporowa, EMS, SQL Developer czy DBEaver mają swoje + i - natomiast ja od wielu lat korzystam z tego narzędzia:
orbada

Po pierwsze jest to narzędzie w pełni darmowe bez żadnych licencji triali itd. Po drugie można go używać do wielu dystrybucji baz danych. Po trzecie miałem okazję pracować z autorem tego narzędzia i wiele rzeczy, które dziś umiem to właśnie jego zasługa. Świetny gość i też programista baz danych więc orbada jest napisana przez programistę baz danych dla programistów baz danych. O kulisach powstania tego narzędzia nie będę tu wspominał natomiast orbada ma wiele narzędzi, które mi osobiście bardzo usprawniają pracę, a których po prostu nie ma w innych edytorach.

Nie mniej Andrzej od jakiegoś czasu nie ma czasu ani zbytnio ochoty rozwijać tego projektu (a szkoda) więc postanowił go sprzedać. Jeżeli ktoś byłby zainteresowany kupnem i rozwojem tego projektu to na SF macie kontakt do autora lub dajcie znać mi.

3 głosy Obserwuj Komentuj Udostępnij

les_paul

2023-02-23 11:42
436 wyświetleń

Upgrade baz danych typu PostgreSQL na przykładzie EuroDB

Gdyby się ktoś zastanawiał, czy warto podnosić wersję bazy danych ;-)

https://pl.euro-linux.com/blog/upgrade-baz-danych-typu-postgresql-na-przykladzie-eurodb/

0 głosów Obserwuj Komentuj Udostępnij

Marcin.Miga

Ach, gdybyż to było takie proste... czasem dana funkcjonalność wersję wyżej działa inaczej...A nie sposób spamiętać, gdzie czego użyłeś, by porównać sobie to z listą zmian. Z tego mniej więcej powodu działam na wielu bazach 9.x

2023-02-27 12:11
0 głosów
Odpowiedz

Marcin.Miga

2023-02-27 12:12
1 głos
Odpowiedz

les_paul

2022-06-09 11:26
841 wyświetleń

Generowanie danych losowych w bazie

Jak wiadomo, generowanie danych losowych w bazach danych mocno się przydaje. Artykuł na temat generowania danych w PostgreSQL za pomocą narzędzi z EuroDB.

https://pl.euro-linux.com/blog/generowanie-danych-losowych-w-postgresql-za-pomoca-narzedzi-eurodb/

Generowanie danych losowych w PostgreSQL za pomocą narzędzi EuroDB

Generowanie danych losowych to jedna z ważniejszych funkcji baz danych. Umożliwia bezpieczne testowanie oraz pomaga rozwijać kompetencje w administracji bazami.

https://pl.euro-linux.com/blog/generowanie-danych-losowych-w-postgresql-za-pomoca-narzedzi-eurodb/

0 głosów Obserwuj Komentuj Udostępnij

Zobacz pozostałe 4 komentarze

mateuszrus

@Dregorio: ja też zaczynałem od ERP. Jaki to był u Ciebie system? Ja zaczynałem od SZBD Firebird i produktu firmy Streamsoft z Zielonej Góry. Poza tworzeniem pobocznych aplikacji w .NET bardzo dużo rzeczy po stronie samego ERP robiliśmy na bazie danych

2022-06-12 08:21
0 głosów
Odpowiedz

Dregorio

@mateuszrus: Optima, dużo SQL i trochę Java

2022-06-12 17:30
0 głosów
Odpowiedz

Wpisy z tagiem: database

Tagi popularne na mikroblogu

Spearhead

not Michal

Prosty jak budowa cepa RBAC (Role Based Access Control) w Supabase

elszczepano

Get size of particular tables in MySQL database

woolfik

les_paul

les_paul

Generowanie danych losowych w PostgreSQL za pomocą narzędzi EuroDB

Praca dla programistów

Forum dyskusyjne

Sprawy administracyjne

O nas

Skontaktuj się z nami