Jak najprościej zaimplementować obsługę słownika w C?

Silv

2020-01-12 22:45

Silv2020-01-12 22:45

Moderator Wiki

Rejestracja:ponad 10 lat
Ostatnio:prawie 3 lata
Lokalizacja:Warszawa

W pewnym momencie mojej radosnej twórczości w języku C okazało się, że trzeba mi zaimplementować obsługę słownika – rozumianego jako lista par klucz-wartość.

Ustaliłem, że potrzebuję, by każdy element słownika był reprezentowany przez parę (ciąg znaków, liczba zmiennoprzecinkowa). Słownik będzie wielokrotnie wykorzystywany, więc zamierzam przechowywać go w pliku.

Nie wiem, jak to najprościej zrobić w C. Przyszły mi do głowy następujące cztery pomysły:

zaimplementowanie własnej obsługi własnej struktury słownika w pliku tekstowym (opcja "hardest");
zaimplementowanie własnej obsługi struktury w jakimś popularnym formacie (np. JSON);
skorzystanie z biblioteki do obsługi jakiegoś popularnego formatu (np. JSON);
skorzystanie z biblioteki do obsługi słowników (o ile taka w ogóle jest dla C) (opcja "softest").

Być-może-istotne-szczegóły-projektowe: przewiduję, że ciąg znaków będzie zawierać następujące znaki: a-z, A-Z, 0-9, łącznik (-) i apostrof. Na razie nie planuję, by zawierał białe znaki; jestem jednak przewidujący, więc pomyślałem, że fajnie by było, gdyby przy implementacji od razu uwzględnić taką możliwość. Przewiduję, że liczba zmiennoprzecinkowa powinna mieć co najmniej dwa miejsca po przecinku; będzie z zakresu (0; 1].

Który z tych pomysłów jest najlepszy (głównie: najprostszy)? Może ktoś zna jakieś biblioteki? Najbardziej chciałbym takie, które są powszechne w repozytoriach dystrybucji Linuksa.

PS. Zapomniałem o dość ważnej rzeczy: jakie operacje przewiduję na słowniku. Otóż:

wyszukiwanie par po kluczu, tj. po ciągu znaków;
dodawanie par;
usuwanie par;
modyfikowanie wartości; ostatecznie mogę to zaimplementować za pomocą usuwania i dodawania, tylko martwię się o wydajność.

Jeszcze jedna uwaga, właśnie co do wydajności: przewiduję, że słownik będzie zawierać co najmniej kilka tysięcy par, a być może i kilkadziesiąt tysięcy (chyba że wcześniej porzucę ten projekt – tak, uwzględniam taką możliwość). Nie wiem, czy to ma znaczenie przy wyborze rozwiązania.

PS2. Fajnie będzie, jeśli będzie łatwo sortować słownik, aczkolwiek to mogę zrobić także jakoś zewnętrznie (może w Bashu?).

Jeszcze przyszło mi do głowy: nie musi to być nawet w języku C. Jednak z uwagi na to, że aktualnie po prostu w nim piszę, oraz z uwagi na wydajność wybrałem go. W przypadku innej technologii wolałbym, by była to taka, którą się posługuję; jako więc alternatywę rozpatruję aktualnie Bash i JavaScript.

edytowany 10x, ostatnio: Silv 2020-01-12 23:02

lion137

2020-01-12 22:59

lion1372020-01-12 22:59

Rejestracja:około 8 lat
Ostatnio:około 7 godzin
Postów:4896

Podstawowe pytanie, jaki ma być ten słownik, dynamiczny? To wtedy, Masz do zaimplementowania strukturę key: value, jako tree lub hash table, jak nie to, to wystarczy prosta tablica.

Silv 2020-01-12 23:00

Nie wiem, czy doczytałeś moje dwie aktualizacje postu? Może odpowiadam na Twoje pytanie.

lion137 2020-01-12 23:03

Widzę, dalej nie wiem, czy to ma być struktura dynamiczna czy nie; jeśli chodzi o sortowanie, to drzewo można łatwo posortować - zwracając inorder

Silv

2020-01-12 23:04

Silv2020-01-12 23:04

Moderator Wiki

Rejestracja:ponad 10 lat
Ostatnio:prawie 3 lata
Lokalizacja:Warszawa

Co to jest struktura dynamiczna, słownik dynamiczny?

enedil

2020-01-12 23:08

enedil2020-01-12 23:08

Rejestracja:ponad 11 lat
Ostatnio:około 7 godzin
Postów:1027

Silv napisał(a):

Co to jest struktura dynamiczna, słownik dynamiczny?

To jest struktura, do której możesz dodawać elementy już po utworzeniu. Najpewniej potrzebujesz właśnie czegoś takiego.
Prosty pomysł, to zaimplementowanie tablicy haszującej z otwartym adresowaniem (poszukaj tylko tego terminu).

Silv

2020-01-12 23:13

Silv2020-01-12 23:13

Moderator Wiki

Rejestracja:ponad 10 lat
Ostatnio:prawie 3 lata
Lokalizacja:Warszawa

Tak, właśnie tak – potrzebuję wykonywać wszystkie cztery wymienione operacje po utworzeniu słownika. Rozumiem więc, @lion137, @enedil, że proponujecie mi wybór pierwszej opcji.

lion137

2020-01-12 23:19

lion1372020-01-12 23:19

Rejestracja:około 8 lat
Ostatnio:około 7 godzin
Postów:4896

Jeszcze pytanie, jaka złożoność Cię interesuje, bo hash table, jak pisze @enedil daje Coi aproksymowaną stałą złożoność stałą (i to jest opcja najprostsza - w sensie kodowania), ale z sortowaniem to już może być gorzej. Z drugiej strony, drzewo(~logn), jak napisałem łatwo posortować.

edytowany 1x, ostatnio: lion137 2020-01-12 23:20

Spearhead

2020-01-12 23:21

Spearhead2020-01-12 23:21

Rejestracja:prawie 6 lat
Ostatnio:około 10 godzin
Postów:1002

Może po prostu zacznij używać C++? Nie musisz wcale korzystać z obiektów, wyjątków, polimorfizmu, szablonów i całego tego dobrodziejstwa, cały kod zostaje jaki był, kompiluje się tak samo (C++ to generalnie mówiąc wstecznie kompatybilny nadzbiór C), a słownikiem będzie std::map lub std::unordered_map. A jak nie to przykładem gotowej implementacji kolekcji w C jest https://github.com/srdja/Collections-C, albo możesz od razu postawić redisa i użyć C API.

Spearhead 2020-01-12 23:22

PS: regexy też są w C++, raczej lepiej udokumentowane niż te POSIX-a

Spine

2020-01-12 23:25

Spine2020-01-12 23:25

Rejestracja:prawie 22 lata
Ostatnio:około godziny
Postów:6648

Dodaj język skryptowy do Twojego projektu:

KamilAdam 2020-01-13 08:23

Jeśli język skryptowy to tylko Scheme, a jeśli Embedded Scheme to tylko CHICKEN Scheme

Silv

2020-01-12 23:30

Silv2020-01-12 23:30

Moderator Wiki

Rejestracja:ponad 10 lat
Ostatnio:prawie 3 lata
Lokalizacja:Warszawa

lion137 napisał(a):

Jeszcze pytanie, jaka złożoność Cię interesuje (…)

To jest jeszcze do dokładnego ustalenia, nie myślałem nad tym za wiele. Ale na szybko: nowe elementy najpewniej będą dodawane rzadko; podczas dodawania często będzie wykonywana modyfikacja; usuwać na razie nie planuję – poza przypadkami implementacji modyfikacji pary jako usunięcie-dodanie; wyszukiwanie będzie najczęstsze i powinno być najszybsze.

Spearhead napisał(a):

Może po prostu zacznij używać C++?

To jest do przemyślenia, tak. ;) No ale żebym zmieniał technologię z projektu na projekt, to chyba nie ja…

A jak nie to przykładem gotowej implementacji kolekcji w C jest https://github.com/srdja/Collections-C, albo możesz od razu postawić redisa i użyć C API.

A tego nie znałem; zobaczę, co to.

Spine napisał(a):

Dodaj język skryptowy do Twojego projektu:

https://www.lua.org/pil/24.html

https://docs.python.org/3/extending/embedding.html

Nie mówię definitywnego "nie", ale… jak wykorzystanie technologii, której nie znam, może mi ułatwić projekt? Przez "ułatwienie" rozumiem w szczególności ułatwienie wykonania go tak, by posiadał jak najmniej błędów.

edytowany 1x, ostatnio: Silv 2020-01-12 23:30

Silv

2020-01-12 23:32

Silv2020-01-12 23:32

Moderator Wiki

Rejestracja:ponad 10 lat
Ostatnio:prawie 3 lata
Lokalizacja:Warszawa

PS. @Spine: chyba że masz na myśli też Bash lub JavaScript. To wtedy OK. Ale przy nich pozostaje to samo pytanie, co do C.

Spearhead

2020-01-12 23:39

Spearhead2020-01-12 23:39

Rejestracja:prawie 6 lat
Ostatnio:około 10 godzin
Postów:1002

Silv napisał(a):

To jest do przemyślenia, tak. ;) No ale żebym zmieniał technologię z projektu na projekt, to chyba nie ja…

Zależy chyba jaki jest cel tego projektu. Edukacja? Jak tak, to żaden problem, nauczysz się czegoś nowego, wpłyniesz na szerokie wody C++, olbrzymia i groźna to kraina, ale właśnie w mojej opinii najlepiej zacząć właśnie od poznania C - sam tak zrobiłem i IMHO to najlepsza droga. Bo właśnie po to w C się walczy z zarządzaniem pamięci żeby potem odkryć dobrodziejstwa takie jak wektor. A jeżeli robisz projekt by coś konkretnego dla ciebie robił, to co za różnica w czym jest napisany... przechodząc zaś na C++ (początkowo raczej "C z klasami") nie będziesz musiał kodu przepisywać, bo kompilator C++ radzi sobie z kodem C (po to cały język stworzono).

Zobacz pozostałe 2 komentarze

Spearhead 2020-01-12 23:51

Jak pisałem nie musisz poznawać całego C++ żeby to działało, wystarczy dodać sam std::map. Możesz nawet skompilować go jako dzieloną bibliotekę .so z wyeksponowanym API i dołączyć do reszty projektu żeby zachować "czystość". Ale jak pisałem, to tylko propozycje.

Silv 2020-01-12 23:56

Może C nie był najlepszym wyborem, zgadzam się; ale wciąż sądzę, że była to najlepsza decyzja, jaką mogłem podjąć w taki krótkim czasie, w jakim ją podjąłem. Myślałem kilka razy nad tym, by opracować całość w Bashu – i tak z niego korzystam – ale oszacowałem, że nie znam go na tyle, by sprawnie rozwiązać ewentualne problemy z wydajnością. W przypadku C oszacowałem, że po prostu żadnych problemów z wydajnością nie będzie. cd.

Spearhead 2020-01-12 23:58

Wydajność zależy od wielu czynników, jak używasz algorytmów o złożoności wykładniczej dla dużych zbiorów danych to i C nie pomoże.

Silv 2020-01-13 00:01

Cd. Nie lubię uczyć się technologii na potrzeby jednej struktury danych, jeszcze bardziej nie lubię przepisywać czegoś, co już działa. — Tak, wiem, zobaczymy, co z tego wątku wyjdzie… może nawet zmienię na C++, bo nie uśmiecha mi się pobierać i konfigurować nowe środowiska, gdy mam już np. kompilator i IDE do C++.

Silv 2020-01-13 00:07

Hm, pewnie powinienem przestawić się na myślenie w kategoriach algorytmów, a nie technologii.

Spine

2020-01-12 23:41

Spine2020-01-12 23:41

Rejestracja:prawie 22 lata
Ostatnio:około godziny
Postów:6648

Silv napisał(a):

Spine napisał(a):

Dodaj język skryptowy do Twojego projektu:

https://www.lua.org/pil/24.html

https://docs.python.org/3/extending/embedding.html

Nie mówię definitywnego "nie", ale… jak wykorzystanie technologii, której nie znam, może mi ułatwić projekt? Przez "ułatwienie" rozumiem w szczególności ułatwienie wykonania go tak, by posiadał jak najmniej błędów.

Reszta projektu dalej będzie w C. Ale dzięki dołączonemu Pythonowi, słownik obsłużysz bezbłędnie, eliminując boilerplate :]

Silv napisał(a):

PS. @Spine: chyba że masz na myśli też Bash lub JavaScript. To wtedy OK. Ale przy nich pozostaje to samo pytanie, co do C.

W sumie głównie Python jako język osadzony w Twojej aplikacji załatwiałby sprawę. No i tak jak pisałem, C by służył do odpalania części aplikacji napisanych w języku Python. Zapis tego dictionary do pliku mógłbyś zrobić jako serializację do pickle => https://wiki.python.org/moin/UsingPickle

Spearhead 2020-01-12 23:42

Chyba jednak overkill dołączać całego Pythona żeby mieć słownik xD

enedil 2020-01-13 07:57

Poza tym, piklowanie to nie jest szczególnie bezpieczna opcja.

lion137

2020-01-12 23:41

lion1372020-01-12 23:41

Rejestracja:około 8 lat
Ostatnio:około 7 godzin
Postów:4896

o jest jeszcze do dokładnego ustalenia, nie myślałem nad tym za wiele. Ale na szybko: nowe elementy najpewniej będą dodawane rzadko; podczas dodawania często będzie wykonywana modyfikacja; >usuwać na razie nie planuję – poza przypadkami implementacji modyfikacji pary jako usunięcie-dodanie; wyszukiwanie będzie najczęstsze i powinno być najszybsze.

Tak, najprościej, to chyba najlepiej zaimplementować hash table, tu dobry wykład:
https://runestone.academy/runestone/books/published/pythonds/SortSearch/Hashing.html#implementing-the-map-abstract-data-type

edytowany 1x, ostatnio: lion137 2020-01-12 23:43

vpiotr

2020-01-12 23:52

~~vpiotr~~2020-01-12 23:52

Rejestracja:ponad 13 lat
Ostatnio:prawie 3 lata

Moja propozycja:

slownik zapisywany w formacie *.properties
w pamieci trzymasz hashmape, tzn. dla klucza liczysz hashcode, wg niego wybierasz kubelek, w kubelku masz liste par klucz-wartosc.(taka podstawowa implementacja)

C nie sluzy do pisania "aplikacji", tak moze bylo z 50 lat temu. Obecnie to tool do programowania systemowego (drivery, kernel, protokoly sieciowe).
Jesli piszesz cos wiekszego to wez C++, tak samo szybkie a mniej meki z problemami schylku XX w.

edytowany 1x, ostatnio: ~~vpiotr~~ 2020-01-13 07:33

alagner

2020-01-13 08:03

~~alagner~~2020-01-13 08:03

Rejestracja:prawie 11 lat
Ostatnio:prawie 3 lata
Postów:1493

@Silv ja Ci już mówiłem: chcesz napisać swój słownik/hashmapę/cokolwiek w ramach nauki - zrób to. W C, C++, w czym chcesz. Ale jeśli realizujesz jakiś projekt a nie piszesz RTOSa i nie masz ograniczeń co do wyboru języka to bierzesz przynajmniej C++ w wersji 11, bo zwyczajnie szkoda się mordować z ubogą biblioteką standardową. Chyba, że chcesz wszystko przy okazji tego projektu poznać od bebechów, to ok. Ale skończy się na zaimplementowaniu pełnej obiektowości i RAII z C++ w C przy użyciu setjmp/longjmp ;)

KamilAdam

2020-01-13 08:27

KamilAdam2020-01-13 08:27

Rejestracja:ponad 6 lat
Ostatnio:8 dni
Lokalizacja:Silesia/Marki
Postów:5505

Standardowa biblioteka do C jest faktycznie uboga, dlatego nie wyobrażam sobie pracy w C bez GLiba. Wszystko to co w normalnych bibliotekach standardowych jest, m. in. Drzewa i Tablice Hashujące. A GLib jest dobrze przetestowany bo jest podstawą do środowiska graficznego GNOME

Mama called me disappointment, Papa called me fat
Każdego eksperta można zastąpić backendowcem który ma się douczyć po godzinach. Tak zostałem ekspertem AI, Neo4j i Nest.js . Przez mianowanie

koszalek-opalek

2020-01-13 08:54

koszalek-opalek2020-01-13 08:54

Rejestracja:około 9 lat
Ostatnio:ponad 2 lata

Silv napisał(a):

Co to jest struktura dynamiczna, słownik dynamiczny?

O chłopie, Ty żartujesz? :)

(Trochę powtórzę po kolegach, ale wybaczcie, to w celu resume...)

Jeśli chcesz się uczyć, to bardzo dobrze, ale sensownie tego nie zrobisz, jeśli jesteś na poziomie pytań powyższych... :)
Jeśli to jest zewnętrzne zlecenie, a możesz zmienić język/technologię -- to koledzy pisali o C++11...
Jeśli to jest zewnętrzne zlecenie, a nie możesz zmienić języka/technologii -- to GLib...
Jeśli to jest zewnętrzne zlecenie, a nie możesz zmienić języka/technologii ani użyć GLib (czy innej gotowej biblioteki), a dodatkowo nie masz czasu na naukę struktur dynamicznych (a w C sprowadza się to do mieszania wskaźnikami), to OSTATECZNIE możesz zrobić coś takiego:

Kopiuj

#define MAX_KEYS 100
struct Dict {
    int size;
    KEY_TYPE kt[MAX_KEYS];
    VAL_TYPE vt[MAX_KEYS];
};

i do tego dopisać odpowiednie funkcje (oczywiście musisz też zdefiniować i odpowiednio obsłużyć typy KEY_TYPE oraz VAL_TYPE)...

edytowany 3x, ostatnio: koszalek-opalek 2020-01-13 08:56

~~alagner~~ 2020-01-13 09:07

jak udzieliłem podobnej (tj. w podobnym duchu) odpowiedzi kiedyś na SO to mnie zgrillowali, że w ogóle dopuszczam użycie złych praktyk. Ostrożnie ;P

koszalek-opalek 2020-01-13 09:08

@alagner: No przecież napisałem OSTATECZNIE... :) Sam uważam to za paskudne... :)

Silv 2020-01-13 22:57

sensownie tego nie zrobisz, jeśli jesteś na poziomie pytań powyższych – chcę się uczyć, ale nie bardzo widzę, jak się uczyć według Ciebie? W tym projekcie chciałbym po prostu, by mi działało. Ale nauka nie zawadzi. Dzięki za podsumowanie. :) — Ach, chyba już wiem, o co chodzi z tym przeciwstawieniem "dynamiczny" – "niedynamiczny". Sobie przypomniałem, że kilka lat temu, ucząc się C++, coś takiego było. Pewnie dlatego nie zapamiętałem tego pojęcia, że struktury "dynamiczne" od razu wydały mi się, hm… lepsze od "statycznych" i tylko tych pierwszych używałem.

KamilAdam

2020-01-13 09:08

KamilAdam2020-01-13 09:08

Rejestracja:ponad 6 lat
Ostatnio:8 dni
Lokalizacja:Silesia/Marki
Postów:5505

koszalek-opalek napisał(a):

Silv napisał(a):

Co to jest struktura dynamiczna, słownik dynamiczny?

O chłopie, Ty żartujesz? :)

(Trochę powtórzę po kolegach, ale wybaczcie, to w celu resume...)

Jeśli chcesz się uczyć, to bardzo dobrze, ale sensownie tego nie zrobisz, jeśli jesteś na poziomie pytań powyższych... :)

Wyróżnienie moje
Dla mnie nazwa słownik dynamiczny też jest dziwna, nowa i niezrozumiała. Szybciej powiedziałbym słownik mutowalny/zmienny w przeciwieństwie do słownika niemutowalnego/niezmiennego

edytowany 2x, ostatnio: KamilAdam 2020-01-13 09:09

enedil

2020-01-13 13:51

enedil2020-01-13 13:51

Rejestracja:ponad 11 lat
Ostatnio:około 7 godzin
Postów:1027

Kamil Żabiński napisał(a):

koszalek-opalek napisał(a):

Silv napisał(a):

Co to jest struktura dynamiczna, słownik dynamiczny?

O chłopie, Ty żartujesz? :)

(Trochę powtórzę po kolegach, ale wybaczcie, to w celu resume...)

Jeśli chcesz się uczyć, to bardzo dobrze, ale sensownie tego nie zrobisz, jeśli jesteś na poziomie pytań powyższych... :)

Wyróżnienie moje
Dla mnie nazwa słownik dynamiczny też jest dziwna, nowa i niezrozumiała. Szybciej powiedziałbym słownik mutowalny/zmienny w przeciwieństwie do słownika niemutowalnego/niezmiennego

Dynamiczny znaczy coś innego niż mutowalny. W niemutowalnym nie można nic zmieniać, a w niedynamicznym (statycznym) można np. zmieniać wartość pod kluczem, o ile taki istnieje. Chodzi tutaj nie o określenie zewnętrznych interakcji z obiektem, a o jego "zdolności". Przykładowo, może być nieco łatwiej zaimplementować słownik oparty na drzewie, jeśli klucze nie będą zmieniane - wystarczy wziąć zbiór kluczy, posortować go, i zbudować w ten sposób zbalansowane drzewo binarne, którego nie trzeba dodatkowo balansować w kolejnych operacjach.

lion137

2020-01-13 14:16

lion1372020-01-13 14:16

Rejestracja:około 8 lat
Ostatnio:około 7 godzin
Postów:4896

Dla mnie nazwa słownik dynamiczny też jest dziwna, nowa i niezrozumiała

Dynamiczna struktura, słownik, lista, to taka, do której możemy, dodawać elementy, dopóki nam pamięci nie zabraknie, w przecieństwie od niej statyczna, to taka, która ma, podczas działania programu, stały rozmiar: tablica, czy hash table z dwóch tablic. Typowy przykład dynamicznej struktury:
https://en.wikipedia.org/wiki/Dynamic_array

KamilAdam 2020-01-13 14:27

Dla tablic to określenie słyszałem, dla słowników - nigdy. Albo coraz bardziej zapominam terminologię ze studiów :D

lion137 2020-01-13 15:20

Chyba tak :) przecież słownik oparty na drzewie binarnym jest dynamiczny!

lion137 2020-01-13 15:21

W hash table też mozna powiekszać rozmiary tablic, albo dokładać linked listy, albo krzyżówka obu sposobów :)

hauleth 2020-01-13 15:47

Chyba, że przygotujemy sobie tablicę i perfekcyjną funkcję haszującą dla zadanego zbioru kluczy.

Silv

2020-01-14 00:09

Silv2020-01-14 00:09

Moderator Wiki

Rejestracja:ponad 10 lat
Ostatnio:prawie 3 lata
Lokalizacja:Warszawa

Pozwolę sobie zrobić jeszcze jedno podsumowanie dotychczasowych pomysłów; umieszczam je tu głównie po to, by mieć je w połączeniu z tematem (a nie gdzieś na kartce). Jakbym się pomylił co do intencji niektórych osób, krzyczcie.

@lion137 proponuje, bym zaimplementował prostą tablicę, drzewo lub tablicę haszującą (np. przy pomocy tego).
@Spearhead proponuje trzy rzeczy: 1) bym odszedł od pomysłu wykonania całości w C i zaczął używać C++, i względem tego wykorzystał albo std::map, albo std::unordered_map; dodaje później, że mogę nawet skompilować go [słownik std::map] jako dzieloną bibliotekę .so z wyeksponowanym API i dołączyć do reszty projektu żeby zachować "czystość"; 2) jeśli wolę wykonać całość w C, to mogę wykorzystać https://github.com/srdja/Collections-C; 3) mogę też skorzystać z C API Redisa.
@Spine proponuje, bym, nie porzucając C, wykorzystał język skryptowy – Lua lub Python. Dodaje później, że w przypadku Pythona mógłbym pomyśleć o formacie danych pickle.
@Kamil Żabiński również proponuje, bym wykorzystał język skryptowy, ale – Scheme; wspomina też o "Embedded Scheme" i "CHICKEN Scheme" (nie wiem jeszcze, czym one są). Później dodaje, że jeśli wykorzystuję bibliotekę standardową w C, to do pary mógłbym wziąć bibliotekę GLib.
@vpiotr proponuje, by słownik zapisywać w formacie .properties i skorzystać z tablicy haszującej. I także radzi odejść od C na rzecz C++.
@alagner także radzi odejść od C na rzecz C++ (przynajmniej w wersji 11).
@koszalek-opalek wspomina o C++, GLib, a jeśli nie mógłbym ich użyć, to w ostateczności mogę wykorzystać statyczną "kolekcję" w C.

Ogólnie najwięcej problemów mam z wymyśleniem, jak sprawnie obsłużyć plik. Ale jeszcze żadnego powyższego pomysłu nie rozważałem dogłębnie, więc może niektóre z nich to uwzględniają. Będę nad tym myślał.

Wszelkie jeszcze inne propozycje mile widziane.

edytowany 3x, ostatnio: Silv 2020-01-14 00:11

lion137

2020-01-14 00:28

lion1372020-01-14 00:28

Rejestracja:około 8 lat
Ostatnio:około 7 godzin
Postów:4896

@Silv: To jakiś żart? https://github.com/lion137/Python-Data-Structures

edytowany 1x, ostatnio: lion137 2020-01-14 00:29

Silv

2020-01-14 03:14

Silv2020-01-14 03:14

Moderator Wiki

Rejestracja:ponad 10 lat
Ostatnio:prawie 3 lata
Lokalizacja:Warszawa

@lion137: Ale co ma być żartem?

UPDATE:

Po pobieżnym zastanowieniu się nad zaproponowanymi rozwiązaniami doszedłem do wniosku, że jedynie dwa z nich opisują najtrudniejszą rzecz, czyli obsługę plików: moduł pickle oraz Redis. Rozwiązania dotyczące tej kwestii opiszę więc najpierw; o pozostałych rozwiązaniach wspominam niżej.

Dokumentacja Pythona zaznacza, że moduł pickle nie jest bezpieczny (cokolwiek to znaczy). Uznałem więc, że dla tak niewielkich potrzeb jak moje nie ma sensu: 1) na tyle zmniejszać zaufania do programu, lub: 2) zużywać czas/energię na dodatkowe zabezpieczanie się tam, gdzie nie oczekiwałem, że będę musiał dodatkowo się zabezpieczać.

Redis wydaje się więc lepszym wyborem z tej dwójki. Niemniej chcę umożliwić innym osobom w miarę bezproblemową instalację programu, który będzie wykorzystywał słownik (idealnie: brak potrzeby instalacji i minimalny proces make). A domyślam się, po pobieżnym poczytaniu o Redisie, że użytkownik programu będzie musiał mieć go zainstalowanego. Nie jestem przekonany, czy taka zależność nie będzie zbytnim obciążeniem – skutkującym niechęcią do używania programu. Na razie więc wstrzymam się z okazywaniem entuzjazmu co do używania Redisa. — Ale od razu zaznaczę, @Spearhead, że wygląda on całkiem-całkiem (i w ogóle dzięki za pokazanie go!). Jeśli nie użyję go teraz, to jeśli tylko nie porzucę projektu, a okaże się przydatny (projekt, nie Redis), zastanowię się, czy Redisa jednak nie użyć.

Podsumowując więc obsługę plików: brakuje mi nadal wiedzy, jak to zrobić. Leży mi wykorzystanie pliku tekstowego, więc co do formatu danych, to skłaniam się do użycia JSON-a, XML-a lub wymienionego przez @vpiotr formatu .properties. Ogólnie: jakiegoś formatu szeroko używanego i możliwego do czytania przez człowieka (choć człowiek nie jest głównym celem).

Co do rozwiązań dotyczących samej struktury danych: skłaniam się ku jakiejś szeroko używanej bibliotece, którą większość przyszłych użytkowników programu powinna mieć (vide wcześniejszy akapit o Redisie: pożądana minimalizacja zależności).

Nie mam prawie żadnych informacji o popularności GLib, ale z racji na jej wiek i przeznaczenie myślę, że nie powinna być mała. Jest to opcja.

Jeszcze mniej wiem o popularności Collections-C. Choć widać, że ma wiele gwiazdek na GitHubie, to ja na przykład o tym wcześniej nie słyszałem (albo słyszałem, ale nie było mi potrzebne i zapomniałem).

Podsumowując więc strukturę danych: potrzeba by mi było informacji o popularności obu wymienionych rozwiązań.

Wszelkie inne rozwiązania nadal mile widziane przeze mnie – choć nie ukrywam, że w tym momencie już wolałbym się skoncentrować na czymś.

PS. Jeśli przeoczyłem jakąś informację, która moje powyższe spostrzeżenia może zmienić – piszcie.

edytowany 7x, ostatnio: Silv 2020-01-14 05:19

lion137 2020-01-14 08:57

@Silv: Odszczekuję 😃 nie doczytałem.

Silv 2020-01-14 12:28

@lion137: OK.

alagner

2020-01-14 07:12

~~alagner~~2020-01-14 07:12

Rejestracja:prawie 11 lat
Ostatnio:prawie 3 lata
Postów:1493

To się trochę problem XY zaczyna robić. Może tak: co ten słownik i plik mają zawierać? Konfigurację? Dane wejściowe? Jakie wartości (inty/stringi czy wartości będą jakieś bardziej skomplikowane?)? Bo może zwykły libconf się nada.

KamilAdam

2020-01-14 08:16

KamilAdam2020-01-14 08:16

Rejestracja:ponad 6 lat
Ostatnio:8 dni
Lokalizacja:Silesia/Marki
Postów:5505

alagner napisał(a):

To się trochę problem XY zaczyna robić. Może tak: co ten słownik i plik mają zawierać? Konfigurację? Dane wejściowe? Jakie wartości (inty/stringi czy wartości będą jakieś bardziej skomplikowane?)? Bo może zwykły libconf się nada.

Jak najbardzie zgadzam się z @alagner. @Silv Redis służy do innych celów. Jeśli potrzebujesz lokalnie w programie słownika to użyj po prostu którejś biblioteki. Na 90% będzie to prostsze niż stawianie Redisa. Redis miałby sens jeśli miałbyś swój program w wielu instancjach i chciał, żeby działał bez stanowo. Wtedy cały stan jest trzymany w Redisie.
Ewentualnie jeśli by twoja aplikacja składała się z wielu niezależnie wdrażanych elementów. Wtedy Redis może służyć jako prosta szyna wymiany informacji. Dokładnie kolejka Pub/Sub.
Dla programu desktopowego Redis to overengineering. I mówię to jako fan Redisa :)

Silv

2020-01-14 12:18

Silv2020-01-14 12:18

Moderator Wiki

Rejestracja:ponad 10 lat
Ostatnio:prawie 3 lata
Lokalizacja:Warszawa

alagner napisał(a):

To się trochę problem XY zaczyna robić. Może tak: co ten słownik i plik mają zawierać? Konfigurację? Dane wejściowe? Jakie wartości (inty/stringi czy wartości będą jakieś bardziej skomplikowane?)?

Napisałem w pierwszym poście:

Ustaliłem, że potrzebuję, by każdy element słownika był reprezentowany przez parę (ciąg znaków, liczba zmiennoprzecinkowa). (…) przewiduję, że ciąg znaków będzie zawierać następujące znaki: a-z, A-Z, 0-9, łącznik (-) i apostrof. Na razie nie planuję, by zawierał białe znaki; jestem jednak przewidujący, więc pomyślałem, że fajnie by było, gdyby przy implementacji od razu uwzględnić taką możliwość. Przewiduję, że liczba zmiennoprzecinkowa powinna mieć co najmniej dwa miejsca po przecinku; będzie z zakresu (0; 1].

@Kamil Żabiński: właśnie się zorientowałem. ;) Ale, jak napisałem, jeszcze może się przydać – gdybym program kiedyś rozwijał.

edytowany 1x, ostatnio: Silv 2020-01-14 12:21

Spearhead

2020-01-14 12:20

Spearhead2020-01-14 12:20

Rejestracja:prawie 6 lat
Ostatnio:około 10 godzin
Postów:1002

Popieram przedmówców, za mało tu kontekstu jest. Teraz na przykład się dowiadujemy, że to nie jest to program do jakichś twoich prywatnych celów, który to sobie będzie hulał na twojej maszynie, lecz będzie dystrybuowany do jakichś "użytkowników", więc lepiej rugować z niego nadmiarowe zależności. Im mniej wiemy tym trudniej się doradza

Silv

2020-01-14 12:23

Silv2020-01-14 12:23

Moderator Wiki

Rejestracja:ponad 10 lat
Ostatnio:prawie 3 lata
Lokalizacja:Warszawa

@Spearhead: ach, może i tak. Jest tak, że front-end programu (na początek CLI) ma umożliwić określenie języka tekstu podanego jako parametr – a w plikach ze słownikami będę przechowywać… cóż, słowniki. ;)

KamilAdam

2020-01-14 13:12

KamilAdam2020-01-14 13:12

Rejestracja:ponad 6 lat
Ostatnio:8 dni
Lokalizacja:Silesia/Marki
Postów:5505

Czyli to jednak jest problem XY, bo nie doczytaliśmy.
Nie potrzebujesz słowników dynamiczny, statyczny czy jako zewnętrzna aplikacja jak Redis.
Potrzebujesz Internationalization and localization

W najprostszej wersji zamiast słownika możesz użyć zwykłej struktury z C z milionem pól. I dla Języka polskiego mieć ją wypełnioną stringami po polsku, a dla angielskiego po angielsku.
I potem zamiast pisać

Kopiuj

printf("Hello World!");

piszesz

Kopiuj

printf(strukturaZTlumaczeniami.helloWorld)

Następnym krokiem może być czytanie struktury z plików, ale to dopiero jak stwierdzisz że nie chce ci się utrzymywać tłumaczenia w kodzie.
Jako format pliku do trzymania tłumaczeń polecam pliki .properties bo to znam z Javy i tam działa.
Ale można użyć cokolwiek np Minimal Mistake (theme do Jekylla) trzyma wszystkie tłumaczenia w jednym pliku yaml

edytowany 1x, ostatnio: KamilAdam 2020-01-14 13:13

Silv

2020-01-14 13:27

Silv2020-01-14 13:27

Moderator Wiki

Rejestracja:ponad 10 lat
Ostatnio:prawie 3 lata
Lokalizacja:Warszawa

Kamil Żabiński napisał(a):

Czyli to jednak jest problem XY

Nie zgadzam się ;); ja się tłumaczę dobrze, jasno, szczerze…

Potrzebujesz Internationalization and localization

Może, może; na razie mnie interesują inne kwestie. Pomyślę na pewno o tej uwadze później.

PS. @Kamil Żabiński: ale nadal nie wiem, jak bezproblemowo obsłużyć dodawanie, modyfikację, usuwanie i wyszukiwanie w pliku, choćby z poziomu C.

Liczba odpowiedzi na stronę

Treść *

Treść

Podgląd

Kliknij, aby dodać treść...

Kliknij, aby dodać załącznik lub wklej ze schowka.

Instrukcja obsługi Markdown

Pomoc 1.18.8

Typografia

Edytor obsługuje składnie Markdown, w której pojedynczy akcent *kursywa* oraz _kursywa_ to pochylenie. Z kolei podwójny akcent **pogrubienie** oraz __pogrubienie__ to pogrubienie. Dodanie znaczników ~~strike~~ to przekreślenie.

Możesz dodać formatowanie komendami , , oraz .

Ponieważ dekoracja podkreślenia jest przeznaczona na linki, markdown nie zawiera specjalnej składni dla podkreślenia. Dlatego by dodać podkreślenie, użyj underline.

Komendy formatujące reagują na skróty klawiszowe: Ctrl+B, Ctrl+I, Ctrl+U oraz Ctrl+S.

Linki

By dodać link w edytorze użyj komendy lub użyj składni [title](link). URL umieszczony w linku lub nawet URL umieszczony bezpośrednio w tekście będzie aktywny i klikalny.

Jeżeli chcesz, możesz samodzielnie dodać link: <a href="link">title</a>.

Wewnętrzne odnośniki

Możesz umieścić odnośnik do wewnętrznej podstrony, używając następującej składni: [[Delphi/Kompendium]] lub [[Delphi/Kompendium|kliknij, aby przejść do kompendium]]. Odnośniki mogą prowadzić do Forum 4programmers.net lub np. do Kompendium.

Wspomnienia użytkowników

By wspomnieć użytkownika forum, wpisz w formularzu znak @. Zobaczysz okienko samouzupełniające nazwy użytkowników. Samouzupełnienie dobierze odpowiedni format wspomnienia, zależnie od tego czy w nazwie użytkownika znajduje się spacja.

Znaczniki HTML

Dozwolone jest używanie niektórych znaczników HTML: <a>, , , <kbd>, <del>, , <dfn>, <pre>, <blockquote>, <hr/>, ,  oraz <img/>.

Skróty klawiszowe

Dodaj kombinację klawiszy komendą notacji klawiszy lub skrótem klawiszowym Alt+K.

Reprezentuj kombinacje klawiszowe używając taga <kbd>. Oddziel od siebie klawisze znakiem plus, np <kbd>Alt+Tab</kbd>.

Indeks górny oraz dolny

Przykład: wpisując H2O i m2 otrzymasz: H₂O i m².

Składnia Tex

By precyzyjnie wyrazić działanie matematyczne, użyj składni Tex.

<tex>arcctg(x) = argtan(\frac{1}{x}) = arcsin(\frac{1}{\sqrt{1+x^2}})</tex>

Kod źródłowy

Krótkie fragmenty kodu

Wszelkie jednolinijkowe instrukcje języka programowania powinny być zawarte pomiędzy obróconymi apostrofami: `kod instrukcji` lub ``console.log(`string`);``.

Kod wielolinijkowy

Dodaj fragment kodu komendą . Fragmenty kodu zajmujące całą lub więcej linijek powinny być umieszczone w wielolinijkowym fragmencie kodu. Znaczniki ``` lub ~~~ umożliwiają kolorowanie różnych języków programowania. Możemy nadać nazwę języka programowania używając auto-uzupełnienia, kod został pokolorowany używając konkretnych ustawień kolorowania składni:

```javascript document.write('Hello World'); ```

Możesz zaznaczyć również już wklejony kod w edytorze, i użyć komendy by zamienić go w kod. Użyj kombinacji Ctrl+`, by dodać fragment kodu bez oznaczników języka.

Tabelki

Dodaj przykładową tabelkę używając komendy . Przykładowa tabelka składa się z dwóch kolumn, nagłówka i jednego wiersza.

Wygeneruj tabelkę na podstawie szablonu. Oddziel komórki separatorem ; lub |, a następnie zaznacz szablonu.

nazwisko;dziedzina;odkrycie
Pitagoras;mathematics;Pythagorean Theorem
Albert Einstein;physics;General Relativity
Marie Curie, Pierre Curie;chemistry;Radium, Polonium

Użyj komendy by zamienić zaznaczony szablon na tabelkę Markdown.

Lista uporządkowana i nieuporządkowana

Możliwe jest tworzenie listy numerowanych oraz wypunktowanych. Wystarczy, że pierwszym znakiem linii będzie * lub - dla listy nieuporządkowanej oraz 1. dla listy uporządkowanej.

Użyj komendy by dodać listę uporządkowaną.

1. Lista numerowana
2. Lista numerowana

Użyj komendy by dodać listę nieuporządkowaną.

* Lista wypunktowana
* Lista wypunktowana
** Lista wypunktowana (drugi poziom)

Składnia Markdown

Edytor obsługuje składnię Markdown, która składa się ze znaków specjalnych. Dostępne komendy, jak formatowanie , dodanie tabelki lub fragmentu kodu są w pewnym sensie świadome otaczającej jej składni, i postarają się unikać uszkodzenia jej.

Dla przykładu, używając tylko dostępnych komend, nie możemy dodać formatowania pogrubienia do kodu wielolinijkowego, albo dodać listy do tabelki - mogłoby to doprowadzić do uszkodzenia składni.

W pewnych odosobnionych przypadkach brak nowej linii przed elementami markdown również mógłby uszkodzić składnie, dlatego edytor dodaje brakujące nowe linie. Dla przykładu, dodanie formatowania pochylenia zaraz po tabelce, mogłoby zostać błędne zinterpretowane, więc edytor doda oddzielającą nową linię pomiędzy tabelką, a pochyleniem.

Skróty klawiszowe

Skróty formatujące, kiedy w edytorze znajduje się pojedynczy kursor, wstawiają sformatowany tekst przykładowy. Jeśli w edytorze znajduje się zaznaczenie (słowo, linijka, paragraf), wtedy zaznaczenie zostaje sformatowane.

Ctrl+B - dodaj pogrubienie lub pogrub zaznaczenie
Ctrl+I - dodaj pochylenie lub pochyl zaznaczenie
Ctrl+U - dodaj podkreślenie lub podkreśl zaznaczenie
Ctrl+S - dodaj przekreślenie lub przekreśl zaznaczenie

Notacja Klawiszy

Alt+K - dodaj notację klawiszy

Fragment kodu bez oznacznika

Alt+C - dodaj pusty fragment kodu

Skróty operujące na kodzie i linijkach:

Alt+L - zaznaczenie całej linii
Alt+, Alt+ - przeniesienie linijki w której znajduje się kursor w górę/dół.
Tab/⌘+] - dodaj wcięcie (wcięcie w prawo)
Shit+Tab/⌘+[ - usunięcie wcięcia (wycięcie w lewo)

Dodawanie postów:

Ctrl+Enter - dodaj post
⌘+Enter - dodaj post (MacOS)

Jak najprościej zaimplementować obsługę słownika w C?

Silv napisał(a):

lion137 napisał(a):

Spearhead napisał(a):

Spine napisał(a):

Silv napisał(a):

Silv napisał(a):

Spine napisał(a):

Silv napisał(a):

vpiotr

alagner

Silv napisał(a):

koszalek-opalek napisał(a):

Silv napisał(a):

Kamil Żabiński napisał(a):

koszalek-opalek napisał(a):

Silv napisał(a):

alagner

alagner napisał(a):

alagner napisał(a):

Kamil Żabiński napisał(a):

Smileys & People

Animals & Nature

Food & Drink

Travel & Places

Activities

Objects

Symbols

Typografia

Linki

Wewnętrzne odnośniki

Wspomnienia użytkowników

Znaczniki HTML

Skróty klawiszowe

Indeks górny oraz dolny

Składnia Tex

Kod źródłowy

Krótkie fragmenty kodu

Kod wielolinijkowy

Tabelki

Lista uporządkowana i nieuporządkowana

Składnia Markdown

Skróty klawiszowe