Jak przetestować metodę która zmienia prywatne pole?

bakunet

2023-06-12 15:48

bakunet2023-06-12 15:48

Rejestracja:prawie 8 lat
Ostatnio:około godziny
Lokalizacja:Polska
Postów:1596

Trochę wstyd, ale złapałem się na tym, że do końca nie wiem jak mogę dobrze napisać testy jednostkowe do metod które modyfikują prywatne pole.

SUT:

Kopiuj

private List<ComponentModel> _indexComponents = new List<ComponentModel>();

public List<ComponentModel> GetIndexComponents(string indexName)
{
    return
        _indexComponents.Any(x => x.IndexName == indexName) ?
        _indexComponents.Where(x => x.IndexName == indexName).ToList() :
        new List<CompanyModel>();
}

public void SetIndexComponents(List<ComponentModel> components, string indexName)
{
    if (_indexComponents.Any(x => x.IndexName == indexName))
    {
        _indexComponents.RemoveAll(x => x.IndexName == indexName);
    }

    _indexComponents.AddRange(components);
}

Test:

Kopiuj

[Fact]
private void SetIndexValue_SetsTheValue()
{
    var value = 12.00M;
    var indexName = "XXX";

    _service.SetIndexValue(value, indexName);
    var result = _service.GetIndexValue(indexName); //żeby przetestować poprawność działania SetIndexValue muszę skorzystać z GetIndexValue :/

    var expected = value;
    Assert.Equal(expected, result);
}

Czy private List<ComponentModel> _indexComponents = new List<ComponentModel>(); powinien być tak naprawdę własnością publiczną, żebym mógł poprawnie przetestować metodę? Czy to dobra praktyka tak upubliczniać pola?

edytowany 1x, ostatnio: Riddle 2023-06-12 16:14

opiszon

2023-06-12 16:02

opiszon2023-06-12 16:02

Rejestracja:ponad 2 lata
Ostatnio:około 2 godziny
Postów:779

W ogóle, bracie, jeżeli nie masz na utrzymaniu rodziny, nie grozi ci głód, nie jesteś Tutsi ani Hutu i te sprawy, to wystarczy, że odpowiesz sobie na jedno zajebiście, ale to zajebiście, ważne pytanie:

Co chcę tu tetować. A potem zacznij to tetować.

Czy na pewno chcesz testować co jest dokładnie w tym prywatnym polu, skoro jest prywatne? Nie wystarczy testować oczekiwanych zachowań kompletu metod set i get?

edytowany 1x, ostatnio: opiszon 2023-06-12 16:02

obscurity

2023-06-12 16:02

obscurity2023-06-12 16:02

Rejestracja:około 6 lat
Ostatnio:32 minuty

Ale po co to w ogóle testować? Co cię obchodzi co klasa sobie robi w środku, testować masz jej zachowanie na zewnątrz. A prywatne pola i metody to często ukryte klasy.

W dodatku kod niepotrzebnie skomplikowany i iterujący wielokrotnie po kolekcjach bez sensu, można uprościć do:

Kopiuj

private List<ComponentModel> _indexComponents = new List<ComponentModel>();

public List<ComponentModel> GetIndexComponents(string indexName) => _indexComponents.Where(x => x.IndexName == indexName).ToList();

public void SetIndexComponents(List<ComponentModel> components, string indexName)
        {
            _indexComponents.RemoveAll(x => x.IndexName == indexName);
            _indexComponents.AddRange(components);
    }

Jak już musisz coś upublicznić dla testów (czasem tak jest dużo łatwiej, np wyłączyć w ten sposób timeouty do debugowania) to częstą praktyką jest użycie internal i InternalsVisibleTo

edytowany 2x, ostatnio: obscurity 2023-06-12 16:08

bakunet 2023-06-12 16:13

Założyłem że RemoveAll rzuci mi wyjątkiem jak nie znajdzie x => x.IndexName == indexName, ale widocznie byo to złe założenie

MarekR22

2023-06-12 16:03

MarekR222023-06-12 16:03

Moderator C/C++

Rejestracja:około 17 lat
Ostatnio:minuta

Testy jednostkowe, które sięgają do czegokolwiek prywatnego to testy, które utrudniają utrzymanie kodu.
Celem testów jest sprawdzanie zewnętrznie widocznej funkcjonalności, a nie detali implementacyjnych.
Tak napisane testy potem blokują refactoring kodu i stają się kulą u nogi.

Zalecałbym pisanie najpierw testów, a potem kodu produkcyjnego. Coś w miarę zbliżonego to TDD lub BDD, wtedy nie piszę się testów naruszających prywatność.

edytowany 5x, ostatnio: MarekR22 2023-06-12 16:07

bakunet

2023-06-12 16:11

bakunet2023-06-12 16:11

Rejestracja:prawie 8 lat
Ostatnio:około godziny
Lokalizacja:Polska
Postów:1596

Ok, do tej pory żyłem w przekonaniu, że jeśli znajduje się logika biznesowa w metodzie która jest publiczna, to należy ją przetestować. Jeśli nie w SetIndexComponents, to w GetIndexComponents jest Where, które mimo wszystko Daje możliwość zwrócenia różnych wartości. Czy chociaż ona powinna być przetestowana?

Riddle

2023-06-12 16:13

Riddle2023-06-12 16:13

Administrator

Rejestracja:prawie 15 lat
Ostatnio:minuta
Lokalizacja:Laska, z Polski
Postów:10056

W ogóle nie powinieneś pisać testu pod tą klasę.

Znajdź miejsce gdzie jej używasz, i w tym miejscu napisz test.

bakunet napisał(a):

Czy private List<ComponentModel> _indexComponents = new List<ComponentModel>(); powinien być tak naprawdę własnością publiczną, żebym mógł poprawnie przetestować metodę? Czy to dobra praktyka tak upubliczniać pola?

Nie i Nie.

Po pierwsze dlatego że to nie ma sensu, po drugie dlatego że złamiesz wtedy enkapsulację, po trzecie że wtedy testy staną się bardziej podatne na false negative, po czwarte dlatego że wtedy refaktor tej klasy będzie trudniejszy, a po piąte dlatego że nawet jak wystawisz to pole, to nic to nie da, bo i tak faktyczny kod tej klasy nie będzie przetestowany tylko to pole - a to wnosi wartość zerową.

edytowany 2x, ostatnio: Riddle 2023-06-12 16:15

opiszon

2023-06-12 16:13

opiszon2023-06-12 16:13

Rejestracja:ponad 2 lata
Ostatnio:około 2 godziny
Postów:779

To napisz taki zestaw testów żeby pokryć wszystkie możliwe przypadki wynikające z logiki wewnątrz get i set.
Dalej da się to zrobić bez upubliczniania listy.

bakunet

2023-06-12 16:16

bakunet2023-06-12 16:16

Rejestracja:prawie 8 lat
Ostatnio:około godziny
Lokalizacja:Polska
Postów:1596

opiszon napisał(a):

To napisz taki zestaw testów żeby pokryć wszystkie możliwe przypadki wynikające z logiki wewnątrz get i set.
Dalej da się to zrobić bez upubliczniania listy.

Ok, po uwadze @obscurity przyznaję, że w SetIndexComponents nie ma logiki. A w testach GetIndexComponents można użyć SetIndexComponents do zapełnienia listy. Nic innego nie przychodzi mi do głowy

Riddle

2023-06-12 16:17

Riddle2023-06-12 16:17

Administrator

Rejestracja:prawie 15 lat
Ostatnio:minuta
Lokalizacja:Laska, z Polski
Postów:10056

bakunet napisał(a):

opiszon napisał(a):

To napisz taki zestaw testów żeby pokryć wszystkie możliwe przypadki wynikające z logiki wewnątrz get i set.
Dalej da się to zrobić bez upubliczniania listy.

Ok, po uwadze @obscurity przyznaję, że w SetIndexComponents nie ma logiki. A w testach GetIndexComponents można użyć SetIndexComponents do zapełnienia listy. Nic innego nie przychodzi mi do głowy

Pokaż miejsce gdzie używasz tych metod.

obscurity

2023-06-12 16:17

obscurity2023-06-12 16:17

Rejestracja:około 6 lat
Ostatnio:32 minuty

bakunet napisał(a):

Ok, do tej pory żyłem w przekonaniu, że jeśli znajduje się logika biznesowa w metodzie która jest publiczna, to należy ją przetestować.

No to bardzo błędne przekonanie, to znaczy częściowo prawdziwe. Kod powinien być przetestowany ale nie bezpośrednio pisząc testy specjalnie do tej klasy, tylko któryś z testów powinien zahaczyć o tę klasę i z niej skorzystać. Pokrycie testami powinno być idealnie 100% a jeśli testy w jakiś sposób nie odpalają kodu to znaczy że jest bezużyteczny i wypada go wywalić.

Tak jak wyżej - nie pisz testów do każdej klasy i metody, pisz testy do każdej funkcjonalności biznesowej. Czyli potrzebujesz prawdopodobnie testu do klasy która korzysta z tej klasy, wtedy pokrywasz testami je obie. Pisanie testów do wszystkiego osobno niepotrzebnie betonuje kod, zniechęca do testów, zachęca do mockowania wszystkiego i jest zazwyczaj bezsensowne i nie przynosi żadnych korzyści. Idealnie jest NIE używać mocków zupełnie, a jeśli już to tylko do zewnętrznych zależności a nie do własnego kodu.

edytowany 1x, ostatnio: obscurity 2023-06-12 16:19

Riddle 2023-06-12 16:26

Co do ostatniej linijki, warto zapoznać się z "Don’t Mock What You Don’t Own".

Ostatni Ninja 2023-06-13 14:27

Lepiej bym tego nie opisał.

bakunet

2023-06-12 16:21

bakunet2023-06-12 16:21

Rejestracja:prawie 8 lat
Ostatnio:około godziny
Lokalizacja:Polska
Postów:1596

Riddle napisał(a):

Pokaż miejsce gdzie używasz tych metod.

Kopiuj

public bool VerifyIfComponentsExists(int year, int month, int day, string indexName)
{
  var components = new List<ComponentModel>();

  components = _appState.GetIndexComponents(indexName);

  return _resultsProcessor.VerifyIfComponentsExists(components, year, month, day);
}

edytowany 1x, ostatnio: Riddle 2023-06-12 16:22

Riddle

2023-06-12 16:22

Riddle2023-06-12 16:22

Administrator

Rejestracja:prawie 15 lat
Ostatnio:minuta
Lokalizacja:Laska, z Polski
Postów:10056

bakunet napisał(a):

Riddle napisał(a):

Pokaż miejsce gdzie używasz tych metod.

Kopiuj

public bool VerifyIfComponentsExists(int year, int month, int day, string indexName)
{
  var components = new List<ComponentModel>();

  components = _appState.GetIndexComponents(indexName);

  return _resultsProcessor.VerifyIfComponentsExists(components, year, month, day);
}

No to z kolei teraz pokaż gdzie używasz tej metody?

edytowany 2x, ostatnio: Riddle 2023-06-12 18:04

bakunet

2023-06-12 16:27

bakunet2023-06-12 16:27

Rejestracja:prawie 8 lat
Ostatnio:około godziny
Lokalizacja:Polska
Postów:1596

Riddle napisał(a):

No to z kolei teraz pokaże gdzie używasz tej metody?

Kopiuj

bool alreadyExistsInAppState = _dataDistributor.VerifyIfComponentsExists(utcNowTimestamp.Year, utcNowTimestamp.Month, utcNowTimestamp.Day, indexName);

if (!alreadyExistsInDb && !_dataDistributor.GetAppStateIsComponentsUpdateInProgress())
{
  (...)
}

Chyba już rozumiem do czego zmierzasz (zmierzacie). Będę musiał się z tym przespać :)

edytowany 1x, ostatnio: Riddle 2023-06-12 16:27

Riddle

2023-06-12 16:29

Riddle2023-06-12 16:29

Administrator

Rejestracja:prawie 15 lat
Ostatnio:minuta
Lokalizacja:Laska, z Polski
Postów:10056

bakunet napisał(a):

Riddle napisał(a):

No to z kolei teraz pokaże gdzie używasz tej metody?

Kopiuj

bool alreadyExistsInAppState = _dataDistributor.VerifyIfComponentsExists(utcNowTimestamp.Year, utcNowTimestamp.Month, utcNowTimestamp.Day, indexName);

if (!alreadyExistsInDb && !_dataDistributor.GetAppStateIsComponentsUpdateInProgress())
{
  (...)
}

No to teraz się zastanów, w jaki sposób Twoje prywatne pole wpływa na wynik .VerifyIfComponentsExists() - dla jakich stanów tego prywatnego pola, ta metoda zwróci true i false. Co by się stało, gdybyś usunął swoje prywatne pole? Jaki test mógłbyś napisać, który wykryłby czy to pole tam jest czy nie. Jaki bug powstałby w aplikacji, gdyby tego pola nie było?

Takie pytania musisz sobie zadać żeby napisać dobre testy.

edytowany 1x, ostatnio: Riddle 2023-06-12 16:29

bakunet

2023-06-12 16:31

bakunet2023-06-12 16:31

Rejestracja:prawie 8 lat
Ostatnio:około godziny
Lokalizacja:Polska
Postów:1596

Riddle napisał(a):

Takie pytania musisz sobie zadać żeby napisać dobre testy.

Tak więc, jeśli GetIndexComponents zwróci złą wartość, to będzie błąd. Jeśli SetIndexComponents zapisze złą wartość, będzie błąd. Choć już zadążyliśmy ustalić, że z SetIndexComponents można się pozbyć ifologii i testy dlań są zbędne.

edytowany 1x, ostatnio: bakunet 2023-06-12 16:32

Riddle

2023-06-12 16:34

Riddle2023-06-12 16:34

Administrator

Rejestracja:prawie 15 lat
Ostatnio:minuta
Lokalizacja:Laska, z Polski
Postów:10056

bakunet napisał(a):

Riddle napisał(a):

Takie pytania musisz sobie zadać żeby napisać dobre testy.

Tak więc, jeśli GetIndexComponents zwróci złą wartość, to będzie błąd. Jeśli SetIndexComponents zapisze złą wartość, będzie błąd.

Nie chodzi o wyjątki i błędy.

Chodzi o to w jaki sposób Twoja aplikacja działa, i zachowa się zależnie od tego czy ten .VerifyIfComponentsExists() zwróci true lub false. Pisząc testy, nie podchodź do aplikacji z myślą "błąd lub nie błąd", tylko w kontekście zachowania - co ta aplikacja zrobi.

bakunet

2023-06-12 16:37

bakunet2023-06-12 16:37

Rejestracja:prawie 8 lat
Ostatnio:około godziny
Lokalizacja:Polska
Postów:1596

@Riddle: Ok, dalej nie kumam czemu nie mam testować GetIndexComponents skoro niepoprawna wartość alreadyExistsInAppState wpłynie na prawidłowe funkcjonowanie aplikacji. Co z tego, że przetestuję przypadki true i false dla alreadyExistsInAppState , skoro GetIndexComponents będzie mi zwracała niepoprawne wartości?

Riddle

2023-06-12 16:38

Riddle2023-06-12 16:38

Administrator

Rejestracja:prawie 15 lat
Ostatnio:minuta
Lokalizacja:Laska, z Polski
Postów:10056

bakunet napisał(a):

@Riddle: Ok, dalej nie kumam czemu nie mam testować GetIndexComponents skoro niepoprawna wartość alreadyExistsInAppState wpłynie na prawidłowe funkcjonowanie aplikacji. Co z tego, że przetestuję przypadki true i false dla alreadyExistsInAppState , skoro GetIndexComponents będzie mi zwracała niepoprawne wartości?

No to napisz test, który w given setupuje taki przypadek, w którym GetIndexComponents zwróci błędne wartości, i napisz asercję pod to alreadyExistsInAppState.

edytowany 1x, ostatnio: Riddle 2023-06-12 16:41

bakunet

2023-06-12 16:42

bakunet2023-06-12 16:42

Rejestracja:prawie 8 lat
Ostatnio:około godziny
Lokalizacja:Polska
Postów:1596

@Riddle: Zakładając że if (!alreadyExistsInDb && !_dataDistributor.GetAppStateIsComponentsUpdateInProgress()) to jest jedyna logika w metodzie która woła wymienione wcześniej serwisy, to co jest złego z

(np tylko jeden test pod true, i jeden pod false)

i oczywiście wszystkimi kombinacjami z !_dataDistributor.GetAppStateIsComponentsUpdateInProgress())?

edytowany 1x, ostatnio: bakunet 2023-06-12 16:42

Riddle

2023-06-12 16:47

Riddle2023-06-12 16:47

Administrator

Rejestracja:prawie 15 lat
Ostatnio:minuta
Lokalizacja:Laska, z Polski
Postów:10056

bakunet napisał(a):

@Riddle: Zakładając że if (!alreadyExistsInDb && !_dataDistributor.GetAppStateIsComponentsUpdateInProgress()) to jest jedyna logika w metodzie która woła wymienione wcześniej serwisy, to co jest złego z

(np tylko jeden test pod true, i jeden pod false)

Na to pytanie sam sobie odpowiedziałeś:

bakunet napisał(a):

Co z tego, że przetestuję przypadki true i false dla alreadyExistsInAppState , skoro GetIndexComponents będzie mi zwracała niepoprawne
wartości?

Musisz przetestować wszystkie przypadki wejściowe, nawet jeśli jest ich więcej niż wyjściowych (czyli w tym wypadku true i false).

bakunet napisał(a):

i oczywiście wszystkimi kombinacjami z !_dataDistributor.GetAppStateIsComponentsUpdateInProgress())?

Nie koniecznie z wszystkimi. Przetestuje je z tyloma kombinacjami, ile jest konieczne żeby się upewnić że kod działa tak jak powinien.

edytowany 1x, ostatnio: Riddle 2023-06-12 16:47

WeiXiao

2023-06-12 21:45

WeiXiao2023-06-12 21:45

Rejestracja:około 9 lat
Ostatnio:około 15 godzin
Postów:5108

//żeby przetestować poprawność działania SetIndexValue muszę skorzystać z GetIndexValue :/

no to co? to źle?

masz API która wystawia dwie metody - Read/Write, no i skąd jakiś religijny pomysł ze do testu metody Write nie możesz użyć Read?

to jest to publiczne API, z niego będą inni korzystać, to API ma działać. A jako że logika w tym kodzie nie jest skomplikowana, ani nie ma jakichś niepewności (losowość, czas, itd itd) to nie ma jakichś szczególnych powodów aby dobierać się do bebechów czy aby na pewno tam jest to, co ma być, bo zakładasz że metoda Read z jakiegoś powodu zwróciłaby coś innego

sprawdź na kilku wartościach czy następuje zmiana i tyle

Kopiuj

return
  _indexComponents.Any(x => x.IndexName == indexName) ?
  _indexComponents.Where(x => x.IndexName == indexName).ToList() :
  new List<CompanyModel>();

a czy tak właściwie to ci się nie upraszcza do

Kopiuj

return _indexComponents.Where(x => x.IndexName == indexName).ToList();

edytowany 8x, ostatnio: WeiXiao 2023-06-12 21:58

znowutosamo4

2023-06-12 23:19

znowutosamo42023-06-12 23:19

Rejestracja:prawie 2 lata
Ostatnio:ponad rok
Postów:32

MarekR22 napisał(a):

Testy jednostkowe, które sięgają do czegokolwiek prywatnego to testy, które utrudniają utrzymanie kodu.
Celem testów jest sprawdzanie zewnętrznie widocznej funkcjonalności, a nie detali implementacyjnych.
Tak napisane testy potem blokują refactoring kodu i stają się kulą u nogi.

Dokładnie z tych samych powodów rozszerzam to podejście, aby w testach jednostkowych nie testować logiki biznesowej, bo to tak samo głupie jak testowanie prywatnej. Po co test jednostkowy ma przetwarzać model skoro przy zmianie modelu trzeba ten test poprawiać?

W testach jednostkowych testuje rzeczy niezależne od biznesu, wtedy weryfikuje podwaliny na jakich buduje funkcjonalność. Testem wówczas dokumentuje działanie kodu i upewniam się, że podwaliny działają zgodnie z założeniem. Z tego powodu nie martwię się o to czy test będzie problemem w utrzymaniu, ponieważ szanse na zmiany są marginalne. Natomiast konkretne funkcjonalności testuje na możliwie najwyższym poziomie np. w selenium, i zwykle tak bywa, że robię to w innym języku niż tym którego używam do implementacji aplikacji. Oczywiście testy funkcjonalności muszę zmieniać, gdy zmieniają się założenia.

EDIT:

Oczywiście zaraz ktoś powie, że testy funkcjonalności to przecież testy jednostkowe, bo testy jednostkowe nie testują przecież metod, klas, a pojedynczą funkcjonalność, która może wymagać użycia kilku klas czy metod. Jaka by nie była definicja testu jednostkowego to warto, aby test był określony na jak najwyższym poziomie (wspomniane selenium lub chociaż api), aby było jak najmniej styczności z modelami. Wiadomo, że będzie jakaś styczność, ale im wyżej rozpocznie się testowanie tym mniej widocznych jest zależności z modelami do pokrycia wymaganych testów.

edytowany 4x, ostatnio: znowutosamo4 2023-06-12 23:37

Zobacz pozostały 1 komentarz

znowutosamo4 2023-06-13 09:38

niezbyt stabilny twór - w jakim sensie? pracuje z selenium od kilku lat i nie miałem z tym problemów

WeiXiao 2023-06-13 14:50

@znowutosamo4: nierzadko miałem tak że np. test nie przechodził, a puszczony ponownie już tak i tego typu problemy. U innych słyszałem podobne opinię typu: That is exactly the problem we had, lots of re-tries. Słyszałem że playwright jest stabilniejszy https://playwright.dev/

znowutosamo4 2023-06-13 15:05

Jeśli ponowne uruchomienie rozwiązuje sprawę to być może wynika z niewłaściwie poprowadzonych waitów. Temat jest szeroki i nieoczywisty, bo waity inaczej się pisze gdy szukasz jednego elementu, inaczej gdy wielu, rzecz bywa kłopotliwa, gdy szukasz jednego z N, lub N z N, i na dodatek na stronach responsywnych ukrywa się więcej elementów chociaż wiesz, że tylko jeden Cię interesuje. Do tej pory nie przypisałbym błędu samemu selenium, bo we wszystkich przypadkach jakie miałem to ja czegoś nie zobaczyłem, nie doprecyzowałem jak trzeba.

WeiXiao 2023-06-13 15:07

Sama potrzeba hakerki waitami nie jest fajna.

znowutosamo4 2023-06-13 15:11

To podobna sprawa jak używanie języka z synchronizowanymi wywołaniami, które blokuje wykonanie kodu do czasu otrzymanego wyniku. Różnicą z waitami jest to, że robisz jawnie, bo dodatkowo precyzujesz warunek, analogicznie jak w przypadku zapytań do bazy.

bakunet

2023-06-13 07:30

bakunet2023-06-13 07:30

Rejestracja:prawie 8 lat
Ostatnio:około godziny
Lokalizacja:Polska
Postów:1596

Doceniam krytyczne opinie, dzięki. Przetrawię je jak będę miał dłuższą chwilę. Możliwe że tu później wrócę z kotrargumentami / pytaniami :)

Krolik

2023-06-15 07:15

Krolik2023-06-15 07:15

Moderator

Rejestracja:prawie 21 lat
Ostatnio:około 3 godziny
Postów:2964

masz API która wystawia dwie metody - Read/Write, no i skąd jakiś religijny pomysł ze do testu metody Write nie możesz użyć Read?

@WeiXiao: Istnieje praktyczny powód. Test który używa read do sprawdzenia write jest tym samym co test używający write do sprawdzenia read. Oczywiście przy bardzo prostych implementacjach to nie jest problem, ale przy nietrywialnych fajnie byłoby wiedzieć, czy zawiódł read czy write, a z takiego testu się nie dowiesz. I nie jest to mój wymysł teoretyczny, tylko nie dalej jak miesiąc temu mieliśmy w firmie realny przypadek, gdzie błąd był w "read", a większość ludzi początkowo pomyślała, że błąd był w "write" i że mamy uszkodzone pliki z danymi. Przy czym read i write to w tym przypadku kobyły na kilka tys. linii. ;) Bo wszystkie weryfikatory tychże plików używały tego samego kodu do odczytu. Kodu, który miał błąd.

Dlatego generalnie przy bardziej złożonym kodzie / złożonych strukturach danych jak najbardziej jest sens dorzucania do kodu dodatkowych metod diagnostycznych używanych wyłącznie w testach, tudzież asercji weryfikujących poprawność stanu wewnętrznego. Asercje też są pewną formą testowania, a działają na prywatnych danych. Przykładowo - jeśli mamy strukturę drzewa zrównoważonego, to chcielibyśmy zapewne przetestować, czy faktycznie jest zrównoważone po każdej operacji, chociaż w publicznym API drzewo nie będzie udostępniać metod do oceny stopnia zrównoważenia (skoro obiecuje że zawsze jest zrównoważone), bo taka metoda raczej byłaby bezużyteczna. Dlatego powinniśmy mieć możliwość:

dostępu do prywatnych bebechów drzewa z testów, albo
napisania metody diagnostycznej udostępniającej pewne metryki jak np. stopień niezrównoważenia drzewa i użycie jej w testach (to podejście wolę bardziej)

Testy jednostkowe, które sięgają do czegokolwiek prywatnego to testy, które utrudniają utrzymanie kodu.
Celem testów jest sprawdzanie zewnętrznie widocznej funkcjonalności, a nie detali implementacyjnych.

@MarekR22: Z tym się nie mogę zgodzić. Utrudniają modyfikację detali implementacyjnych, ale za to precyzyjniej lokalizują błąd, oraz ułatwiają zrozumienie implementacji (testy są też formą dokumentacji). Jako że kod częściej się wykonuje / czyta niż modyfikuje, zwłaszcza implementacje, to uważam że wartość którą dodają takie testy jest większa niż ich wada. Testy implementacji też można pisać tak, aby zminimalizować ryzyko konieczności ich zmieniania - np. powinny testować niezmienniki / fundamentalne założenia projektowe dla danego modułu a nie detale. Tak jak wyżej napisałem, jeśli fundamentalną cechą drzewa zrównoważonego jest to że jest zrównoważone, to powinno to być przetestowane, nawet jeśli wymaga to dostępu do wewnętrznej struktury drzewa.

BTW: I przestańmy patrzeć na wszystko przez pryzmat Javy/C#. To dział Inżyniera oprogramowania.
Nie wszystko musi być podzielone na klasy, i nie każdy język ma takie głupie ograniczenia że pola mogą być tylko prywatne bądź publiczne i nic pomiędzy.
To co jest publiczne dla modułu X, może być prywatne z punktu widzenia modułu Y. Dlatego to jest kwestia względna. Są po prostu różne poziomy abstrakcji na której działają testy i warto korzystać z wielu, bo to jest pewien trade-off. Testy end-to-end są skrajnym przypadkiem testów testujących tylko to co naprawdę publiczne. Ale one mają znikomą wartość diagnostyczną zwykle, choć mają dużą siłę wykrywania błędów.

edytowany 3x, ostatnio: Krolik 2023-06-15 07:27

somekind 2023-06-15 12:43

nie każdy język ma takie głupie ograniczenia że pola mogą być tylko prywatne bądź publiczne i nic pomiędzy. - trochę bez sensu pisać o takich ograniczeniach w zdaniu, w którym pisze się o C#. To, że Java ma jakiś problem z enkapsulacją na różnych poziomach, nie znaczy, że wszystkie języki mają.

WeiXiao 2023-06-15 17:33

@Krolik: ja się zgadzam, ale przecież napisałem że:

A jako że logika w tym kodzie nie jest skomplikowana, ani nie ma jakichś niepewności (losowość, czas, itd itd) to nie ma jakichś szczególnych powodów

Riddle

2023-06-15 07:34

Riddle2023-06-15 07:34

Administrator

Rejestracja:prawie 15 lat
Ostatnio:minuta
Lokalizacja:Laska, z Polski
Postów:10056

Krolik napisał(a):

masz API która wystawia dwie metody - Read/Write, no i skąd jakiś religijny pomysł ze do testu metody Write nie możesz użyć Read?

@WeiXiao: Istnieje praktyczny powód. Test który używa read do sprawdzenia write jest tym samym co test używający write do sprawdzenia read. Oczywiście przy bardzo prostych implementacjach to nie jest problem, ale przy nietrywialnych fajnie byłoby wiedzieć, czy zawiódł read czy write, a z takiego testu się nie dowiesz. I nie jest to mój wymysł teoretyczny, tylko nie dalej jak miesiąc temu mieliśmy w firmie realny przypadek, gdzie błąd był w "read", a większość ludzi początkowo pomyślała, że błąd był w "write" i że mamy uszkodzone pliki z danymi. Przy czym read i write to w tym przypadku kobyły na kilka tys. linii. ;) Bo wszystkie weryfikatory tychże plików używały tego samego kodu do odczytu. Kodu, który miał błąd.

Dlatego generalnie przy bardziej złożonym kodzie / złożonych strukturach danych jak najbardziej jest sens dorzucania do kodu dodatkowych metod diagnostycznych używanych wyłącznie w testach, tudzież asercji weryfikujących poprawność stanu wewnętrznego. Asercje też są pewną formą testowania, a działają na prywatnych danych. Przykładowo - jeśli mamy strukturę drzewa zrównoważonego, to chcielibyśmy zapewne przetestować, czy faktycznie jest zrównoważone po każdej operacji, chociaż w publicznym API drzewo nie będzie udostępniać metod do oceny stopnia zrównoważenia (skoro obiecuje że zawsze jest zrównoważone), bo taka metoda raczej byłaby bezużyteczna. Dlatego powinniśmy mieć możliwość:

dostępu do prywatnych bebechów drzewa z testów, albo

napisania metody diagnostycznej udostępniającej pewne metryki jak np. stopień niezrównoważenia drzewa i użycie jej w testach (to podejście wolę bardziej)

Noo, nie zgadzam się, z kilku powodów.

Po pierwsze, jeśli masz metody write i read, i załóżmy dla uproszczenia że to są jedyne akcje jakie wystawia system, to nie potrzebujesz dwóch testów (osobnego dla read() i osobnego dla write()), tylko wystarczy jeden, np write(x); assert(x, read());. Tzn możesz niby napisać dwa, ale one będą identyczne; skoro jedyna szansa żeby sprawdzić jedną metodę, jest użycie drugiej.
- Odpowiadając na cytat od @Krolik
  
  Krolik napisał(a):
  
  ale przy nietrywialnych fajnie byłoby wiedzieć, czy zawiódł read czy write, a z takiego testu się nie dowiesz.
- Takie podejście nie jest dobre - takie "wiedzenie" która metoda zawiódła. Bo jeśli masz jeden test który robi read i write, i to są Twoje jedyne access pointy do aplikacji, to nie istnieje obiektywny sposób żeby stwierdzić czy zawiódł read czy write. Kontrakt tych dwóch metod jest taki że read() ma zwrócić to co write() wsadził i tyle, ale to w jaki sposób to robią to powinien być szczegół implementacyjny.
- Więc z punktu widzenia dobrych testów i TDD; pomysł żeby "wiedzieć która metoda zawiodła" nie specjalnie ma rację bytu. Nie istnieje żaden sensowny testu który usprawiedliwiłby taki koncept, i istnieć nie może.
- Ciche założenie, jak rozumiem, to np takie założenie że write() i read() mają zapisać coś do bazy, powiedzmy. I wtedy faktycznie, na dwa sposoby taki test może sfailć. Albo może być błąd INSERT (bo np się nie dodaje, albo dodaje pod złym id), albo błąd może być w SELECT (bo np wyciąga po złym id, albo robi WHERE który zwraca pusty result).
- W takim wypadku musisz sobie odpowiedzieć na jedno ważne (ale to zajefajnie ważne ;) pytanie: Czy baza jest Twoim szczegółem implementacyjnym, czy częścią interfejsu.
  - Jeśli baza jest szczegółem implementacyjnym, to żaden test sprawdzający "która metoda sfailowała" nie może istnieć, i ten INSERT i SELECT należy traktować jako "jeden byt", nawet jeśli jest w dwóch metodach (bo od obu z nich zależy czy operacja się uda czy nie; bez sensu jest próbować je rozdzielać i myśleć o nich jak o "dwóch metodach"). Więc dwie metody write() i read() należy traktować jako jedną funkcjonalność, która albo działa w całości, albo nie działa. Z punktu widzenia testów, powiedzenie "write" nie działa, albo "read" nie działa nie ma sensu; bo ich "nie działanie" widać tylko poprzez tą drugą metodę. Nie możesz wykonać write() i stwierdzić czy działa czy nie działa.
  - Jeśli natomiast baza jest interfejsem, to musisz napisać po każdym teście asercję z bazy która robi selecta i sprawdza dokładnie co w nie jest; tylko wtedy nie możesz nigdy mieć testu który woła read() i write() razem - bo wtedy one już nie są swoją częscią, tylko oba ciągną z bazy.
Po drugie, wystawianie metryk albo metod diagnozujących, moim zdaniem jest średnie, bo nawet takie metody diagnozujące mogą wystawić złe dane;
- więc test który przechodzi dla takich metod diagnozujących, nawet jesli przejdzie; to nie koniecznie znaczy to że faktyczne dane używane przez system również są poprawne. Żeby się tego upewnić należy napisać dobry test dla tego systemu; i wtedy takie funkcje diagnozujące są niepotrzebne.
- Pomijam to ze takie funkcje diagnozujące łamią enkapsulację i utrudniają późniejszą pracę z systemem

edytowany 2x, ostatnio: Riddle 2023-06-15 07:36

Krolik

2023-06-15 07:42

Krolik2023-06-15 07:42

Moderator

Rejestracja:prawie 21 lat
Ostatnio:około 3 godziny
Postów:2964

Takie podejście nie jest dobre - takie "wiedzenie" która metoda zawiódła. Bo jeśli masz jeden test który robi read i write, i to są Twoje jedyne access pointy do aplikacji, to nie istnieje obiektywny sposób żeby stwierdzić czy zawiódł read czy write. Kontrakt tych dwóch metod jest taki że read() ma zwrócić to co write() wsadził i tyle, ale to w jaki sposób to robią to powinien być szczegół implementacyjny.

Na tym polega różnica między podejściem teoretyka, a praktyka. W teorii akademickiej masz rację. Praktyka tworzenia oprogramowania to coś znacznie więcej niż tylko aby read przeczytał to co zrobił write.
W praktyce takie write może mieć znacznie bardziej rozbudowany kontrakt. Choćby ze względu na kompatybilność wsteczną i dalszy rozwój systemu. Jeżeli ktoś będzie pracował w przyszłości na tym kodzie i w projekcie ma założenia, że np. wewnętrzna struktura zapisywana przez write ma mieć posortowane kolumny wg jakiegoś porządku, to będzie na tej własności polegał pisząc nowy kod. I ta własność powinna być przetestowana. A jak ja spieprzy dodając nowy kod, to ma dostać testami na czerwono. Testami wskazującymi, że naruszył jakiś fundament write.

Więc z punktu widzenia dobrych testów i TDD; pomysł żeby "wiedzieć która metoda zawiodła" nie specjalnie ma rację bytu. Nie istnieje żaden sensowny testu który usprawiedliwiłby taki koncept, i istnieć nie może.

Zalatuje religią i dogmatami.
Jak mi się test wywali, to chcę wiedzieć gdzie poprawiać. Odrzucenie 50% kodu na starcie to duży zysk czasu.

W takim wypadku musisz sobie odpowiedzieć na jedno ważne (ale to zajefajnie ważne ;) pytanie: Czy baza jest Twoim szczegółem implementacyjnym, czy częścią interfejsu.

Nie muszę, bo zarówno jedno jak i drugie warto testować. Z innych powodów, ale warto.
Poza tym jak napisałem wyżej, to nie jest podział czarno-biały. Są wsystkie odcienie szarości pomiędzy. Coś co jest interfejsem dla modułu X, może być tylko szczegółem implementacyjnym dla modułu Y. I co teraz?

Po drugie, wystawianie metryk albo metod diagnozujących, moim zdaniem jest średnie, bo nawet takie metody diagnozujące mogą wystawić złe dane;

Parafrazując: Pisanie testów jest średnie, bo nawet testy mogą zawierać błędy.

Jeśli natomiast baza jest interfejsem, to musisz napisać po każdym teście asercję z bazy która robi selecta i sprawdza dokładnie co w nie jest; tylko wtedy nie możesz nigdy mieć testu który woła read() i write() razem - bo wtedy one już nie są swoją częscią, tylko oba ciągną z bazy.

Też nie. To, że mam testy jednostkowe testujące osobno read i osobno write nie oznacza że nie wolno mi napisać testu integracynego sprawdzającego oba na raz. Zwłaszcza że w takim teście zapewne będę mógł bardziej poszaleć z generacją danych. Znowu - są różne testy i mają różne zastosowania i różne mocne/słabe strony. NIe ma sensu dogmatycznie trzymać się jednego rodzaju testów.

edytowany 2x, ostatnio: Krolik 2023-06-15 07:46

Zobacz pozostałe 2 komentarze

Riddle 2023-06-15 09:11

Są różne lewele tego jak możesz ulepszać aplikacje. Z braku testów, lepiej ewoluować do słabych testów. Ale potem, jak chcesz usprawnić aplikacje dalej to musisz odejść od testów które łamią enkalsulacje do takich które są agnostic. Trochę jak pytanie czy narzędzia z brązu są dobre czy nie - z perspektywy narzędzi kamiennych, owszem, są i to bardzo. Z perspektywy narzędzi żelaznych, nie tak bardzo. Wyobraź sobie że ktoś Ci mówi żebyś odszedł od narzędzi z brązu na rzecz narzędzi z zależa, ale mając ciągle w głowie narzędzia z kamienia sądzisz ze brąz jest praktyczny i...

Riddle 2023-06-15 09:12

...nie warto od niego odchodzić. Podobnie mamy z testami. Takie które łamią enkalsulacje i mają metody diagnostyczne są dobrym krokiem pośrednim, koniecznym krokiem, ale ostatecznie trzeba od tego odejść na rzecz lepszych rozwiązań - i takim są testy które nie łamią enkalsulacji.

Krolik 2023-06-15 09:12

Test, który testuje interfejs prywatnej metody nie łamie enkapsulacji tej metody. Nadal testuje metodę jako black box. A to że metoda jest prywatna to enkapsulacja na innym poziomie. Po prostu można mieć testy na różnym poziomie - testujące interfejs całego systemu (np. jego REST API), testujące opubliczne metody jakiejś klasy, albo testujące prywatne komponenty. Nie oznacza to wcale łamania enkapsulacji. Łamanie enkapsulacji to byś miał jakby test testujący unit X sięgał do prywatnych bebechów unitu Y, który jest używane przez X.

Riddle 2023-06-15 09:28

@Krolik: Im więcej testy wiedzą o implementacji tego co testują tym gorszej są jakości, z wielu powodów. Jeśli masz test który testuje prywatny komponent, to w momencie w którym chcesz zrefaktorować ten prywatny komponent, ale w taki sposób że on nadal działa tak samo, to żaden test nie powinien sfailować. Jeśli masz testy które reference'ują ten prywatny komponent, to wtedy po pierwsze test testy sfailują, a po drugie będą Ci utrudniać refaktor. Dodatkowo przez taki fail nie wiesz czy wprowadziłeś buga czy nie; bo testy failują tak czy tak. Z tego powodu są gorsze.

Riddle 2023-06-15 09:29

A zawsze istnieje sposób jak można przetestować wszystkie elementy z szerszego scope'u (w taki sposób żeby testy nie reference'owały bezpośrednio swoich implementacji), i z tego powodu są lepsze do utrzymania. Więc jeśli masz takie testy (a powinieneś takie mieć), to nie masz powodu żeby pisać takie które dotykają prywatnych elementów i są wtedy tylko kulą u nogi.

Riddle

2023-06-15 07:52

Riddle2023-06-15 07:52

Administrator

Rejestracja:prawie 15 lat
Ostatnio:minuta
Lokalizacja:Laska, z Polski
Postów:10056

Krolik napisał(a):

Takie podejście nie jest dobre - takie "wiedzenie" która metoda zawiódła. Bo jeśli masz jeden test który robi read i write, i to są Twoje jedyne access pointy do aplikacji, to nie istnieje obiektywny sposób żeby stwierdzić czy zawiódł read czy write. Kontrakt tych dwóch metod jest taki że read() ma zwrócić to co write() wsadził i tyle, ale to w jaki sposób to robią to powinien być szczegół implementacyjny.

Na tym polega różnica między podejściem teoretyka, a praktyka. W teorii akademickiej masz rację. Praktyka tworzenia oprogramowania to coś znacznie więcej niż tylko aby read przeczytał to co zrobił write.
W praktyce takie write może mieć znacznie bardziej rozbudowany kontrakt. Choćby ze względu na kompatybilność wsteczną i dalszy rozwój systemu. Jeżeli ktoś będzie pracował w przyszłości na tym kodzie i w projekcie ma założenia, że np. wewnętrzna struktura zapisywana przez write ma mieć posortowane kolumny wg jakiegoś porządku, to będzie na tej własności polegał. I ta własność powinna być przetestowana.

No okej, Ty sobie to nazywasz podejście "teoretyka", ale ja takie podejście stosuję w swoich komercyjnych projektach od lat. Więc dla mnie to nie jest nic "teoretycznego".

Jeśli write() ma rozbudowany kontrakt, to powinny być testy pod ten kontrakt, i one wtedy mają tą siłę diagnostyczną której potrzebujesz.

Więc z punktu widzenia dobrych testów i TDD; pomysł żeby "wiedzieć która metoda zawiodła" nie specjalnie ma rację bytu. Nie istnieje żaden sensowny testu który usprawiedliwiłby taki koncept, i istnieć nie może.

Zalatuje religią i dogmatami.
Jak mi się test wywali, to chcę wiedzieć gdzie poprawiać. Odrzucenie 50% kodu na starcie to duży zysk czasu.

Rozumiem, że dla Ciebie może tak zalatywać - jeśli nie praktykujesz takiego podejścia. Jeśli masz jakiś projekt publiczny który używa takich metod, to bardzo chętnie mógłbym Ci pokazać jak możnaby dobrze napisać taki test który jest rzetelny, a jednocześnie nie wymaga takich metod diagnostycznych.

No widzę dwa case'y:

Jeśli read() i write() wiedzą tylko o sobie, to po prostu nie ma sensu test który wykryłby w której metodzie jest błąd. Trochę to przypomina sytuację w której dwie osoby mówią do siebie innym językiem, to nie jesteś w stanie stwierdzić która z tych osób mówi "złym" - chyba, że jest dodatkowe założenie które sugeruje jakim językiem powinni mówić (np angielskim). Tak samo jest z tym read(), write() jeśli one mają działać razem, to kiedy test failuje, nie jesteś w stanie stwierdzić która z nich nie działa - chyba, że dodasz dodatkowe założenie gdzie powinni te dane zapisać (np w bazie).
Natomiast jeśli read() i write() mają inne kontrakty, również to że kompatybilność wsteczna, ale również jakikolwiek inny; to pod to też należy napisać test - no przecież chcemy to mieć sprawdzone - i wtedy taki test nam załatwi wszystkie potrzebne rzeczy które musimy sprawdzić; i wtedy tych metody diagnostycznych nie potrzebujesz. W gruncie rzeczy wystawienie metody diagnostycznej to jest po prostu złamanie enkapsulacji - jeśli jest wystawiasz to równie dobrze mógłbyś czytać pola prywatne, z testowego punktu widzenia to byłoby to samo. Tylko właściwie jest to gorsze, bo łamiąc enkapsulację przynajmniej przetestujesz to co kod robi (ściśle bo ściśle, testy rigid, tight-coupling, ale przynajmniej przetestujesz). Z takimi metodami diagnozującymi nie wiesz czy testujesz faktyczny kod, czy testujesz tylko te metody diagnozujące, a to co robi kod jest nieprzetestowane.

Krolik napisał(a):

Nie muszę, bo zarówno jedno jak i drugie warto testować. Z innych powodów, ale warto.

Niektórych rzeczy nie warto testować - np szczegółów implementacyjnych.

Poza tym jak napisałem wyżej, to nie jest podział czarno-biały. Są wsystkie odcienie szarości pomiędzy. Coś co jest interfejsem dla modułu X, może być tylko szczegółem implementacyjnym dla modułu Y. I co teraz?

Testy moduły X piszesz pod "to coś" jako interfejs, testy modułu Y piszesz pod "to coś" jako szczegół implementacyjny.

Po drugie, wystawianie metryk albo metod diagnozujących, moim zdaniem jest średnie, bo nawet takie metody diagnozujące mogą wystawić złe dane;

Parafrazując: Pisanie testów jest średnie, bo nawet testy mogą zawierać błędy.

No owszem, testy mogą zawierać błędy; dlatego stosujemy TDD, i najpierw widzimy jak test failuje, potem dopisujemy funkcjonalność, i teraz test przechodzi. Poza tym, nawet jak nie zrobiliśmy testów w TDD; nadal możemy łatwo sprawdzić czy test działa. Jeśli znajdziemy test który sprawdza jakąś funkcjonalnośc, wystarczy specjalnie dodać buga, i sprawdzić czy test sfailuje - jeśli tak, to jest wartościowy. Jeśli nie, to ma buga w sobie albo jest redundant, i można go wyrzucić (zakładając że dodaliśmy tego buga, i widać w aplikacji że ten bug jest).

Natomiast z metodami diagnozujacymi sytuacja jest inna, bo nie jesteś za ich pomocą w stanie stwierdzić czy system działa czy nie - tzn. działa, tylko przy założeniu że faktycznie te metody diagnozujące zwracają 100% danych na który operuje kod; i tego założenia nie jesteś w stanie specjalnie sprawdzić.

edytowany 4x, ostatnio: Riddle 2023-06-15 07:55

Krolik

2023-06-15 08:07

Krolik2023-06-15 08:07

Moderator

Rejestracja:prawie 21 lat
Ostatnio:około 3 godziny
Postów:2964

Tylko właściwie jest to gorsze, bo łamiąc enkapsulację przynajmniej przetestujesz to co kod robi (ściśle bo ściśle, testy rigid, tight-coupling, ale przynajmniej przetestujesz). Z takimi metodami diagnozującymi nie wiesz czy testujesz faktyczny kod, czy testujesz tylko te metody diagnozujące, a to co robi kod jest nieprzetestowane.

Nie, to jest praktycznie to samo. Różni się lokalizacją kodu testowego. Metoda diagnostyczna jest formalnie częścią testu, natomiast właśnie ze względu na czytelność kodu lepiej ją mieć bliżej danych na których działa. I metoda diagnostyczna powinna być oznaczona jako testowa, w produkcie końcowym jej nie ma.

Poza tym, nawet jak nie zrobiliśmy testów w TDD; nadal możemy łatwo sprawdzić czy test działa. Jeśli znajdziemy test który sprawdza jakąś funkcjonalnośc, wystarczy specjalnie dodać buga, i sprawdzić czy test sfailuje - jeśli tak, to jest wartościowy. Jeśli nie, to ma buga w sobie albo jest redundant, i można go wyrzucić (zakładając że dodaliśmy tego buga, i widać w aplikacji że ten bug jest).

To nie gwarantuje braku bugów. Nadal możesz mieć niepoprawny test działający na niepoprawnym kodzie, który przechodzi na zielono.
Możesz napisać najpierw niepoprawny test, a potem niepoprawny kod, który go przechodzi. Sytuacja identyczna jak z metodami diagnostycznymi. Identyczna, bo kod diagnostyczny i tak stosujesz - są częścią testów. To jest tylko kwestia organizacji kodu, semantycznie niczym się nie różni.

Tak przy okazji, nigdy nie widziałem, aby TDD faktycznie powodowało lepszą jakość kodu, natomiast widziałem wielokrotnie jak prowadziło właśnie do patalogicznie złych designów i przesadnie skomplikowanego kodu najeżonego ifami. Bo zmusza programistę do myślenia o kodzie przez pryzmat przypadków, a nie ogólnego rozwiązania problemu.

Testy moduły X piszesz pod "to coś" jako interfejs, testy modułu Y piszesz pod "to coś" jako szczegół implementacyjny.

Tak, oczywiście z tym się zgadzam. Ale z tego wynika wprost, że mogę mieć coś takiego jak "interfejs / kontrakt wewnętrzny" dla klasy (czyli metody i struktury prywatne) i też mogę pisać pod to testy. Czyli mogę testować klasy/metody prywatne.

I znowu, przestańmy patrzeć przez pryzmat klas / obiektów / interfejsów OOP ala Java. Testowanie jest tematem bardziej ogólnym, a organizacja kodu w klasy i obiekty nie jest jedynym sensownym sposobem organizacji kodu. Metoda prywatna też ma interfejs - zapisany w swoim kontrakcie.

edytowany 2x, ostatnio: Krolik 2023-06-15 08:12

wartek01

2023-06-15 08:54

wartek012023-06-15 08:54

Rejestracja:ponad 12 lat
Ostatnio:około 3 godziny
Postów:3544

Krolik napisał(a):

Test który używa read do sprawdzenia write jest tym samym co test używający write do sprawdzenia read. Oczywiście przy bardzo prostych implementacjach to nie jest problem, ale przy nietrywialnych fajnie byłoby wiedzieć, czy zawiódł read czy write, a z takiego testu się nie dowiesz. I nie jest to mój wymysł teoretyczny, tylko nie dalej jak miesiąc temu mieliśmy w firmie realny przypadek, gdzie błąd był w "read", a większość ludzi początkowo pomyślała, że błąd był w "write" i że mamy uszkodzone pliki z danymi. Przy czym read i write to w tym przypadku kobyły na kilka tys. linii. ;) Bo wszystkie weryfikatory tychże plików używały tego samego kodu do odczytu. Kodu, który miał błąd.

Z mojego punktu widzenia to jest po prostu nieprawidłowo napisany test. Z tego co zrozumiałem to write tworzy jakiś plik (lub go modyfikuje), a read go odczytuje.

Test read powinien polegać na tym, że masz jakiś predefiniowany input.file i sprawdzasz, czy to co read wypluło jest zgodne z tym, co według ciebie wypluć powinno.
W przypadku write masz sytuację odwrotną - czyli wrzucasz jakąś strukturę danych do write, tworzy ci się jakiś output.file, i na końcu sprawdzasz, czy ten plik jest zgodny z tym, co być powinno.
Natomiast zewnętrzne zależności nie zawsze istnieją. Przykładem jest dowolny obiekt przechowujący stan wyłącznie w pamięci - np. Counter, który ma dwie metody: void increment() i int value(). W takim przypadku testy value oraz increment (czyli odczytu i zapisu) muszą być testowane razem - bo stworzenie obiektu Counteri używanie tylko jednej z tych metod nie ma żadnego sensu - samo increment() nie robi nic, a samo value() będzie zawsze zwracało 0.
I tak, dopuszczam możliwość, że istnieją jakieś bardzo wyjątkowe sytuacje, w których monitorowanie prywatnych pól będzie uzasadnione. Ale są to właśnie wyjątkowe sytuacje, a co do zasady powinno się tego unikać.

edytowany 2x, ostatnio: wartek01 2023-06-15 09:00

Riddle

2023-06-15 09:21

Riddle2023-06-15 09:21

Administrator

Rejestracja:prawie 15 lat
Ostatnio:minuta
Lokalizacja:Laska, z Polski
Postów:10056

Krolik napisał(a):

Tylko właściwie jest to gorsze, bo łamiąc enkapsulację przynajmniej przetestujesz to co kod robi (ściśle bo ściśle, testy rigid, tight-coupling, ale przynajmniej przetestujesz). Z takimi metodami diagnozującymi nie wiesz czy testujesz faktyczny kod, czy testujesz tylko te metody diagnozujące, a to co robi kod jest nieprzetestowane.

Nie, to jest praktycznie to samo. Różni się lokalizacją kodu testowego. Metoda diagnostyczna jest formalnie częścią testu, natomiast właśnie ze względu na czytelność kodu lepiej ją mieć bliżej danych na których działa. I metoda diagnostyczna powinna być oznaczona jako testowa, w produkcie końcowym jej nie ma.

To po co ta metoda ma w ogóle być w kodzie produkcyjnym, czemu po prostu nie przenieść jej do testów?

Poza tym, nawet jak nie zrobiliśmy testów w TDD; nadal możemy łatwo sprawdzić czy test działa. Jeśli znajdziemy test który sprawdza jakąś funkcjonalnośc, wystarczy specjalnie dodać buga, i sprawdzić czy test sfailuje - jeśli tak, to jest wartościowy. Jeśli nie, to ma buga w sobie albo jest redundant, i można go wyrzucić (zakładając że dodaliśmy tego buga, i widać w aplikacji że ten bug jest).

To nie gwarantuje braku bugów.

Oczywiście że nie. Żadna metoda nie gwarantuje braku bugów. Ale niektóre metody są lepsze niż inne do ich ograniczenia. Moim zdaniem TDD jest jedną z lepszych (jak nie najlepszą).

Nadal możesz mieć niepoprawny test działający na niepoprawnym kodzie, który przechodzi na zielono.
Możesz napisać najpierw niepoprawny test, a potem niepoprawny kod, który go przechodzi. Sytuacja identyczna jak z metodami diagnostycznymi. Identyczna, bo kod diagnostyczny i tak stosujesz - są częścią testów. To jest tylko kwestia organizacji kodu, semantycznie niczym się nie różni.

Nie sądzę że jesteś w stanie to zrobić. A przynajmniej jest to bardzo trudne.

Weź pod uwagę:

Piszesz test (zły, ale jeszcze tego nie wiesz)
Odpalasz test, i on ma nie przejść
Piszesz mały kawałek kodu produkcyjnego
Odpalasz zły test, i on teraz przechodzi po dopisaniu tego małego kawałka logiki

Bardzo trudno byłoby napisać zły test który najpierw by sfailował, a potem po dopisaniu odpowiedniej logiki by przeszedł. Właśnie na tym polega cała moc TDD. Owszem, znajdą się takie przypadki pewnie raz na tysiąc, ale to można wtedy bezproblemowo poprawić kolejnym testem.

Jest to możliwe, ale zakłada że programista popełni dwa błedy po sobie - najpierw pisząc test, potem pisząc kod; i to jeszcze takie błędy które nawzajem się enforce'ują (tzn brak kodu == fail, dodanie kodu == pass). To jest niesamowicie rzadki przypadek. I nawet jego wystąpienie nic takiego złego nie robi, bo nawet jakby tam był bug, to na 99% zostanie złapany przez następny test.

Krolik napisał(a):

Sytuacja identyczna jak z metodami diagnostycznymi. Identyczna, bo kod diagnostyczny i tak stosujesz - są częścią testów. To jest tylko kwestia organizacji kodu, semantycznie niczym się nie różni.

No to ponawiam pytanie, czemu nie przenieść tej funkcji do testów? Bo jeśli odpowiedź brzmi "dlatego żeby się dostać do prywatnych pól", to to nie jest semantycznie to samo. Żeby to było to samo, to taka metoda diagnostyczna musiałaby czytać tylko i wyłącznie publiczne pola i metody, i tylko te które są faktyczną częścią publicznego interfejsu żeby to było semantycznie to samo. Jeśli tak jest w istocie to nie mam problemu z takimi funkcjami. Jeśli faktycznie dotykają tylko i wyłącznie publicznych części interfejsu (które tak samo można by łatwo przetestować z testów jak tymi metodami diagnostycznymi), to zwracam honor - i takie funkcje jednak są okej. Wcześniej pomyślałem że te funkcje diagnostyczne dlatego są w kodzie produkcyjnym, żeby czytać pola prywatne i dlatego uznałem że są złe. Tylko jeśli tak jest to nadal nie rozumiem po co trzymać te funkcje przy kodzie, zamiast w testach.

Krolik napisał(a):

Tak przy okazji, nigdy nie widziałem, aby TDD faktycznie powodowało lepszą jakość kodu, natomiast widziałem wielokrotnie jak prowadziło właśnie do patalogicznie złych designów i przesadnie skomplikowanego kodu najeżonego ifami.

To nie widziałeś nigdy TDD.

Z tego co mówisz, widziałeś jedynie projekty w który autor twierdził że praktykował TDD, podczas gdy to nie było to (tylko albo nie do końca to umiał, albo zrobił jakąś swoją fantazję, albo coś jeszcze innego).

Jeśli chcesz zobaczyć dobry przykład, to mogę pokazać swój projekt: https://github.com/t-regx/crlf Możesz przejrzeć historię powstawania, albo popatrzeć całościowo na origin/master na efekt końcowy.

Krolik napisał(a):

Bo zmusza programistę do myślenia o kodzie przez pryzmat przypadków, a nie ogólnego rozwiązania problemu.

No, i to się trochę mija z prawdę, bo w TDD właśnie o to chodzi żeby dotrzeć do ogólnego rozwiązania problemu, takiego który jest general/generic i pasuje do wielu przypadków. Jak powstaje Ci kod najeżony ifami to właśnie nie jest generic, tylko specific, i to nie jest TDD. To jakaś smutna wizja.

Jeśli widziałeś takie przypadki w swojej karierze, to to nie było TDD.

edytowany 7x, ostatnio: Riddle 2023-06-15 09:34

Zobacz pozostałe 17 komentarzy

Krolik 2023-06-15 10:09

Nie, problemem nie jest wielkość funkcji a liczba bytów, która została powołana do życia. Ten kod jest obiektywnie bardziej skomplikowany niż powinien. Ale to w sumie nie ma żadnego znaczenia. Ten kod nie działa.

Riddle 2023-06-15 10:10

@Krolik: Ale to nie wynikło z TDD - to wynikło z preferencji autora.

Krolik 2023-06-15 10:13

TDD nie pomogło uzyskać spójnego, ładnego rozwiązania. Sudoku jest taką łamigłówką, gdzie właśnie łatwo robić bardzo długą listę specyficznych, prostych przypadków, które wiadomo jak powinny działać, ale można nadal kompletnie nie wiedzieć jak rozwiązać problem w sposób ogólny. I moja tezza jest taka, że TDD w żadnym stopniu nie przybliża Cię do rozwiązania ogólnego, a wręcz przeszkadza. Przeszkadza, bo Roy skoncentrował się na jakiś duperelach związanych z obsługą planszy, zamiast ugryźć problem, wymyślić algorytm i na końcu napisać testy.

Riddle 2023-06-15 10:13

@Krolik: A co do tego że nie działa; co możemy zrobić. No mogę faktycznie zciagnąć ten program i sprawdzić czy działa czy nie działa. Jeśli wierzyć temu co mówisz, czyli fakycznie że gość napisał testy które sprawdzają jedno, a kod nadal nie działa, to to jest bullshit a nie TDD i gość się nie zna.

Krolik 2023-06-15 10:14

Nie działa, bo nie dokończył. Tu w ogóle nie ma kodu rozwiązującego sudoku. Jest kod do zarządzania stanem planszy.

Liczba odpowiedzi na stronę

Treść *

Treść

Podgląd

Kliknij, aby dodać treść...

Kliknij, aby dodać załącznik lub wklej ze schowka.

Instrukcja obsługi Markdown

Pomoc 1.18.8

Typografia

Edytor obsługuje składnie Markdown, w której pojedynczy akcent *kursywa* oraz _kursywa_ to pochylenie. Z kolei podwójny akcent **pogrubienie** oraz __pogrubienie__ to pogrubienie. Dodanie znaczników ~~strike~~ to przekreślenie.

Możesz dodać formatowanie komendami , , oraz .

Ponieważ dekoracja podkreślenia jest przeznaczona na linki, markdown nie zawiera specjalnej składni dla podkreślenia. Dlatego by dodać podkreślenie, użyj underline.

Komendy formatujące reagują na skróty klawiszowe: Ctrl+B, Ctrl+I, Ctrl+U oraz Ctrl+S.

Linki

By dodać link w edytorze użyj komendy lub użyj składni [title](link). URL umieszczony w linku lub nawet URL umieszczony bezpośrednio w tekście będzie aktywny i klikalny.

Jeżeli chcesz, możesz samodzielnie dodać link: <a href="link">title</a>.

Wewnętrzne odnośniki

Możesz umieścić odnośnik do wewnętrznej podstrony, używając następującej składni: [[Delphi/Kompendium]] lub [[Delphi/Kompendium|kliknij, aby przejść do kompendium]]. Odnośniki mogą prowadzić do Forum 4programmers.net lub np. do Kompendium.

Wspomnienia użytkowników

By wspomnieć użytkownika forum, wpisz w formularzu znak @. Zobaczysz okienko samouzupełniające nazwy użytkowników. Samouzupełnienie dobierze odpowiedni format wspomnienia, zależnie od tego czy w nazwie użytkownika znajduje się spacja.

Znaczniki HTML

Dozwolone jest używanie niektórych znaczników HTML: <a>, , , <kbd>, <del>, , <dfn>, <pre>, <blockquote>, <hr/>, ,  oraz <img/>.

Skróty klawiszowe

Dodaj kombinację klawiszy komendą notacji klawiszy lub skrótem klawiszowym Alt+K.

Reprezentuj kombinacje klawiszowe używając taga <kbd>. Oddziel od siebie klawisze znakiem plus, np <kbd>Alt+Tab</kbd>.

Indeks górny oraz dolny

Przykład: wpisując H2O i m2 otrzymasz: H₂O i m².

Składnia Tex

By precyzyjnie wyrazić działanie matematyczne, użyj składni Tex.

<tex>arcctg(x) = argtan(\frac{1}{x}) = arcsin(\frac{1}{\sqrt{1+x^2}})</tex>

Kod źródłowy

Krótkie fragmenty kodu

Wszelkie jednolinijkowe instrukcje języka programowania powinny być zawarte pomiędzy obróconymi apostrofami: `kod instrukcji` lub ``console.log(`string`);``.

Kod wielolinijkowy

Dodaj fragment kodu komendą . Fragmenty kodu zajmujące całą lub więcej linijek powinny być umieszczone w wielolinijkowym fragmencie kodu. Znaczniki ``` lub ~~~ umożliwiają kolorowanie różnych języków programowania. Możemy nadać nazwę języka programowania używając auto-uzupełnienia, kod został pokolorowany używając konkretnych ustawień kolorowania składni:

```javascript document.write('Hello World'); ```

Możesz zaznaczyć również już wklejony kod w edytorze, i użyć komendy by zamienić go w kod. Użyj kombinacji Ctrl+`, by dodać fragment kodu bez oznaczników języka.

Tabelki

Dodaj przykładową tabelkę używając komendy . Przykładowa tabelka składa się z dwóch kolumn, nagłówka i jednego wiersza.

Wygeneruj tabelkę na podstawie szablonu. Oddziel komórki separatorem ; lub |, a następnie zaznacz szablonu.

nazwisko;dziedzina;odkrycie
Pitagoras;mathematics;Pythagorean Theorem
Albert Einstein;physics;General Relativity
Marie Curie, Pierre Curie;chemistry;Radium, Polonium

Użyj komendy by zamienić zaznaczony szablon na tabelkę Markdown.

Lista uporządkowana i nieuporządkowana

Możliwe jest tworzenie listy numerowanych oraz wypunktowanych. Wystarczy, że pierwszym znakiem linii będzie * lub - dla listy nieuporządkowanej oraz 1. dla listy uporządkowanej.

Użyj komendy by dodać listę uporządkowaną.

1. Lista numerowana
2. Lista numerowana

Użyj komendy by dodać listę nieuporządkowaną.

* Lista wypunktowana
* Lista wypunktowana
** Lista wypunktowana (drugi poziom)

Składnia Markdown

Edytor obsługuje składnię Markdown, która składa się ze znaków specjalnych. Dostępne komendy, jak formatowanie , dodanie tabelki lub fragmentu kodu są w pewnym sensie świadome otaczającej jej składni, i postarają się unikać uszkodzenia jej.

Dla przykładu, używając tylko dostępnych komend, nie możemy dodać formatowania pogrubienia do kodu wielolinijkowego, albo dodać listy do tabelki - mogłoby to doprowadzić do uszkodzenia składni.

W pewnych odosobnionych przypadkach brak nowej linii przed elementami markdown również mógłby uszkodzić składnie, dlatego edytor dodaje brakujące nowe linie. Dla przykładu, dodanie formatowania pochylenia zaraz po tabelce, mogłoby zostać błędne zinterpretowane, więc edytor doda oddzielającą nową linię pomiędzy tabelką, a pochyleniem.

Skróty klawiszowe

Skróty formatujące, kiedy w edytorze znajduje się pojedynczy kursor, wstawiają sformatowany tekst przykładowy. Jeśli w edytorze znajduje się zaznaczenie (słowo, linijka, paragraf), wtedy zaznaczenie zostaje sformatowane.

Ctrl+B - dodaj pogrubienie lub pogrub zaznaczenie
Ctrl+I - dodaj pochylenie lub pochyl zaznaczenie
Ctrl+U - dodaj podkreślenie lub podkreśl zaznaczenie
Ctrl+S - dodaj przekreślenie lub przekreśl zaznaczenie

Notacja Klawiszy

Alt+K - dodaj notację klawiszy

Fragment kodu bez oznacznika

Alt+C - dodaj pusty fragment kodu

Skróty operujące na kodzie i linijkach:

Alt+L - zaznaczenie całej linii
Alt+, Alt+ - przeniesienie linijki w której znajduje się kursor w górę/dół.
Tab/⌘+] - dodaj wcięcie (wcięcie w prawo)
Shit+Tab/⌘+[ - usunięcie wcięcia (wycięcie w lewo)

Dodawanie postów:

Ctrl+Enter - dodaj post
⌘+Enter - dodaj post (MacOS)

Jak przetestować metodę która zmienia prywatne pole?

bakunet napisał(a):

opiszon napisał(a):

bakunet napisał(a):

opiszon napisał(a):

bakunet napisał(a):

Riddle napisał(a):

bakunet napisał(a):

Riddle napisał(a):

Riddle napisał(a):

bakunet napisał(a):

Riddle napisał(a):

Riddle napisał(a):

bakunet napisał(a):

Riddle napisał(a):

bakunet napisał(a):

bakunet napisał(a):

bakunet napisał(a):

bakunet napisał(a):

MarekR22 napisał(a):

Krolik napisał(a):

Krolik napisał(a):

Krolik napisał(a):

Krolik napisał(a):

Krolik napisał(a):

Krolik napisał(a):

Krolik napisał(a):

Krolik napisał(a):

Krolik napisał(a):

Smileys & People

Animals & Nature

Food & Drink

Travel & Places

Activities

Objects

Symbols

Typografia

Linki

Wewnętrzne odnośniki

Wspomnienia użytkowników

Znaczniki HTML

Skróty klawiszowe

Indeks górny oraz dolny

Składnia Tex

Kod źródłowy

Krótkie fragmenty kodu

Kod wielolinijkowy

Tabelki

Lista uporządkowana i nieuporządkowana

Składnia Markdown

Skróty klawiszowe