Jak skalować websockety? :: 4programmers.net

NamingException

2021-03-24 21:30

NamingException2021-03-24 21:30

Rejestracja:ponad 4 lata
Ostatnio:około 4 lata
Postów:110

0

Mój pomysł na pracę dyplomową na podyplomówce Big Data o streamowaniu danych zaczyna się komplikować.
Nie pomyślałem wcześniej o tym jak będę skalował tę aplikację, a o to przecież chodzi w tym całym Big Data.

W skrócie aplikacja będzie robić to:

O ile Apache Kafka czy Postgres umie działać na klastrach, więc się skaluje o tyle Springowe Websockety nie.
Potrzebuję jakiegoś brokera STOMP? ActiveMQ? RabitMQ z biblioteką do STOMP?
No, bo na front streamować z Kafki to chyba słabe rozwiązanie?

NamingException 2021-03-24 21:32

oczywiście między frontend a bazą jest jakiś serwis crudowy

Charles_Ray

2021-03-24 21:42

Charles_Ray2021-03-24 21:42

Rejestracja:około 17 lat
Ostatnio:około 4 godziny
Postów:1875

1

Jakiś broker wiadomości, może być RabbitMq albo Redis. Chociaż masz już tam Kafkę, to nie wiem po co dokładać.

A dlaczego websocket, a nie np. HTTP/2 push albo SSE? Jak będziesz skalowalnoć websockety na load balancerze?

I co robi tam ten biedny Postgres w świecie Big Data? :)

Ogólnie też bez konkretów nt. wolumenu danych, liczby użytkowników, wymagań odnośnie latency ciężko coś zaproponować sensownego. Może dałoby radę to opazdzierzyć na postgresie i zrobić zwykły polling. Wyjdź od czegoś prostego.

edytowany 6x, ostatnio: Charles_Ray 2021-03-24 21:52

Pinek 2021-03-25 08:16

Przecie Postgres właśnie dobrze sobie radzi w świecie Big Data

Charles_Ray 2021-03-25 09:53

Chyba jakaś nie-ACID-owa odmiana

m94

2021-03-24 21:54

~~m94~~2021-03-24 21:54

Rejestracja:około 4 lata
Ostatnio:około 4 lata
Postów:42

1

Musisz utworzyć zdalny rejestr MultiServerUserRegistry i zrobić load balancing

NamingException 2021-03-24 22:20

load balancing to mógłby być temat na osobną pracę dyplomową...

NamingException 2021-03-24 22:38

hm, a może rzeczywiście pieprznąć temat i napisać pracę o load balancowaniu...

NamingException

2021-03-24 22:20

NamingException2021-03-24 22:20

Rejestracja:ponad 4 lata
Ostatnio:około 4 lata
Postów:110

0

Charles_Ray napisał(a):

Jakiś broker wiadomości, może być RabbitMq albo Redis. Chociaż masz już tam Kafkę, to nie wiem po co dokładać.

Kafka nie obsługuje protokołu STOMP...

A dlaczego websocket, a nie np. HTTP/2 push albo SSE? Jak będziesz skalowalnoć websockety na load balancerze?

no właśnie nie wiem jak...

I co robi tam ten biedny Postgres w świecie Big Data? :)

A jaką inną bazę proponujesz?
Dane będą ustrukturyzowane. Postgres skaluje się elegancko i ma dedykowaną wersję do szeregów czasowych: timescaledb

Charles_Ray

2021-03-25 06:49

Charles_Ray2021-03-25 06:49

Rejestracja:około 17 lat
Ostatnio:około 4 godziny
Postów:1875

1

Co tu jest chyba fundamentalnie nie tak, wyglada jakby było mega scouplowane. Na Kafce masz eventy, które konsumenci pushują do websocketa i dopiero tam mówimy o stompie.

Nie znam tej bazy i nie wiem co tam chcesz trzymać - może to być use case na Cassandrę, może na Influxa, ale nie znam wymagań :)

Ogólnie poczytaj o Lambda/Kappa Architecture, nie musisz wynajdywać koła od nowa.

edytowany 2x, ostatnio: Charles_Ray 2021-03-25 07:19

jarekr000000

2021-03-25 07:10

jarekr0000002021-03-25 07:10

Rejestracja:ponad 8 lat
Ostatnio:około 9 godzin
Lokalizacja:U krasnoludów - pod górą
Postów:4707

1

Z ciekawostek to jest coś takiego jak CockroachDB i jest to rozproszona baza danych dość dobrze udająca Postgresa (na poziomie protokołu i SQL).
Udawanie postgresa na pewno działa dobrze. Co do skalowania to niestety poza "marketingiem" wiem niewiele więcej - mam za małe (na razie) aplikacje na tym.

PanamaJoe

2021-03-25 11:50

~~PanamaJoe~~2021-03-25 11:50

Rejestracja:ponad 4 lata
Ostatnio:około 3 lata
Postów:310

0

Pisałeś tu https://4programmers.net/Forum/Off-Topic/350683-websocket_do_notowan_kryptowalut?p=1755998#id1755998 że będziesz dane z sieci zasysać. Rozumiem, że w jakiś sposób przetworzysz te dane i wyslesz na swój front. Sorry, jeżeli coś upraszczam, ale po co w ogóle Ci w takim razie jest Postgress, znaczy właściwie DB w ogólności? Co Ty w tej DB chcesz trzymać?

NamingException

2021-03-25 20:40

NamingException2021-03-25 20:40

Rejestracja:ponad 4 lata
Ostatnio:około 4 lata
Postów:110

0

Charles_Ray napisał(a):

Nie znam tej bazy i nie wiem co tam chcesz trzymać - może to być use case na Cassandrę, może na Influxa, ale nie znam wymagań :)

PanamaJoe napisał(a):

Pisałeś tu https://4programmers.net/Forum/Off-Topic/350683-websocket_do_notowan_kryptowalut?p=1755998#id1755998 że będziesz dane z sieci zasysać. Rozumiem, że w jakiś sposób przetworzysz te dane i wyslesz na swój front. Sorry, jeżeli coś upraszczam, ale po co w ogóle Ci w takim razie jest Postgress, znaczy właściwie DB w ogólności? Co Ty w tej DB chcesz trzymać?

np. tak o:

To DB to w sumie kij z nim, może go nie być, ale kafka ma connectory, więc to mam za darmo.** Problem jest w tym, że z Apache Kafka Streams nie wiem jak wysłać na front.**

edytowany 2x, ostatnio: NamingException 2021-03-25 20:42

Charles_Ray

2021-03-25 20:58

Charles_Ray2021-03-25 20:58

Rejestracja:około 17 lat
Ostatnio:około 4 godziny
Postów:1875

0

Problem jest w tym, że z Apache Kafka Streams nie wiem jak wysłać na front.

Pierwszy wynik w Google https://www.confluent.io/blog/webify-event-streams-using-kafka-connect-http-sink/

Jak pisałem wcześniej, nie tylko websockety są na świecie, tym bardziej, że nie potrzebujesz komunikacji w 2 strony.

edytowany 1x, ostatnio: Charles_Ray 2021-03-25 20:59

JacekPs

2021-03-25 20:59

JacekPs2021-03-25 20:59

Rejestracja:prawie 6 lat
Ostatnio:około rok
Postów:24

1

@NamingException: W Quarkusie np, możesz zmapować kafkowy topic na reactive Publisher, a następnie wystawić taki publisher jako SSE endpoint.

NamingException

2021-03-25 21:00

NamingException2021-03-25 21:00

Rejestracja:ponad 4 lata
Ostatnio:około 4 lata
Postów:110

0

Czyli co ma od razu z kafki na front słać?

kafka -> Quarkus -> SSE
brzmi dobrze

edytowany 1x, ostatnio: NamingException 2021-03-25 21:02

JacekPs

2021-03-25 21:03

JacekPs2021-03-25 21:03

Rejestracja:prawie 6 lat
Ostatnio:około rok
Postów:24

1

Przykładowy kod:

Kopiuj

    @Incoming("sseIncoming")
    @Outgoing("sseChannel")
    @Acknowledgment(Acknowledgment.Strategy.PRE_PROCESSING)
    public SpecificRecord toSSE(Message<SpecificRecord> message) {
        return message.getPayload();
    }

    @Inject
    @Channel("sseChannel")
    private Publisher<SpecificRecord> events;

    @GET
    @Path("/stream")
    @Produces(MediaType.SERVER_SENT_EVENTS)
    @SseElementType("text/plain")
    public Publisher<SpecificRecord> stream(String param) {
        return events;
    }

Sse-incoming jest zmapowany na kafka topic. Jak zaatakujesz ten endpoint z przeglądarki dostaniesz SSE eventy z każdym kafka eventem na topicu.

edytowany 3x, ostatnio: JacekPs 2021-03-25 21:32

NamingException

2021-03-25 21:05

NamingException2021-03-25 21:05

Rejestracja:ponad 4 lata
Ostatnio:około 4 lata
Postów:110

0

A jak to skalować? On na Kafce robi endpoint SSE, tak? Czy robi endpoint z kafki do SSE

edytowany 2x, ostatnio: NamingException 2021-03-25 21:05

JacekPs

2021-03-25 21:12

JacekPs2021-03-25 21:12

Rejestracja:prawie 6 lat
Ostatnio:około rok
Postów:24

1

Pobiera eventy z kafki i publikuje je ze swojego reactive Publishera (akurat w tym przypadku na tego publishera jest zmapowany topic kafkowy bo pasuje do Twojego use-casu, równie dobrze możesz utworzyć swojego publishera ze statycznych danych).
Jeśli chciałbyś mieć więcej takich serwisów, musiałbyś tworzyć każdy z inną kafka-consumer-grupą.

Charles_Ray

2021-03-26 19:29

Charles_Ray2021-03-26 19:29

Rejestracja:około 17 lat
Ostatnio:około 4 godziny
Postów:1875

0

Ludzie przecież jaki kolega framework zastosuje jest absolutnie wtórne :D zmiana pakietu, z którego pochodzą adnotacje nie pomoże architekturze

JacekPs

2021-03-26 19:50

JacekPs2021-03-26 19:50

Rejestracja:prawie 6 lat
Ostatnio:około rok
Postów:24

0

@Charles_Ray: To była raczej kontynuacja Twojej myśli, żeby wykorzystać SSE by na biężaco updatować front.
Twój komentarz sugeruje, że websockety trudniej skalować niż SSE. Możesz rozwinąć dlaczego?

edytowany 1x, ostatnio: JacekPs 2021-03-26 19:51

Charles_Ray

2021-03-27 07:49

Charles_Ray2021-03-27 07:49

Rejestracja:około 17 lat
Ostatnio:około 4 godziny
Postów:1875

1

Utrzymywanie stałego dedykowanego połączenia websocketowego (pierwotne połączenie http + TCP) wymaga więcej zasobów na load balancerze. Hardkorowych detali nie znam, można doczytać na blogu haproxy.

wartek01

2021-03-27 08:36

wartek012021-03-27 08:36

Rejestracja:ponad 12 lat
Ostatnio:około godziny
Postów:3586

0

Pytanie co tak naprawdę to ma robić. Zakładając, że UC jest taki - dane lecą z live-feedów i powinny trafiać zarówno do frontu, jak i na dysk - to pomiędzy Kafką i frontem potrzebujesz jakiegoś skalowalnego cache'a.
To może być albo taki faktyczny skalowalny cache (Ignite, Redis), albo timeseries database (to zależy od scenariusza - ja korzystałem tylko z InfluxDB, KDB+ i Azure TS Insights).
Jeśli chodzi o zapis na dysku to sky is the limit. Podobno nawet Kafka daje radę do trzymania danych, ale nigdy nie korzystałem - ale to by znaczyło, że stack technologiczny ładnie się redukuje do Kafka + cache + ewentualnie coś jako bramka do cache'u.

edytowany 1x, ostatnio: wartek01 2021-03-27 08:38

Jak skalować websockety?

NamingException

Charles_Ray

m94

NamingException

Charles_Ray napisał(a):

Charles_Ray

jarekr000000

PanamaJoe

NamingException

Charles_Ray napisał(a):

PanamaJoe napisał(a):

Charles_Ray

JacekPs

NamingException

JacekPs

NamingException

JacekPs

Charles_Ray

JacekPs

Charles_Ray

wartek01

Praca dla programistów

Forum dyskusyjne

Sprawy administracyjne

O nas

Skontaktuj się z nami