Używa ktoś produkcyjnie, któregoś z wymienionych (lub innych) notebooków do analizy danych i publikowania rezultatów dla klienta?
Interesuje mnie jak klient zareagował na taką technologię i aspekty wdrożeniowe (w szczególności security). Ktoś coś?
Ja używam Jupytera do tworzenia pipeline'ów przetwarzania i analizy danych dla klientów, w których łączę np. Pythona z R i Julią. Dotyczy to jednak głównie zastosowań naukowych dla sektora akademickiego i komercyjnych dla sektora prywatnego. Nie wiem jak odpowiedzieć na pytanie o bezpieczeństwo takiego rozwiązania. Ogólnie dane są udostępniane przez klienta, a ja tworzę pipeline, po czym wysyłam gotowy notebook zawierający analizy oraz komplementarny opis wymaganych zależności i przeprowadzanych operacji wraz z interpretacją wyników w markdownie. Obowiązuje mnie oczywiście zakaz udostępniania danych innym podmiotom etc.
Jeśli chodzi o bezpieczeństwo, to mam na myśli:
- ograniczenie dostępu do notebooków dla użytkowników zalogowanych/określonych ról (userA ma dostęp do Notebook1,3,5, userB do notebook2,4,6 itp.)
- brak loginów/haseł w notebookach
Używasz jednej instancji dla wszystkich klientów, czy może osobne instancje?
Inne kwestie, to uwiecznianie notebooków (lokalny system plików, czy może coś innego?) i ich wersjonowanie? Git, inne, brak wersjonowania?
- Dane od klientów trzymam lokalnie na zewnętrznym nośniku (serwer), po czym usuwam je po zakończeniu współpracy.
- Pracuję sam, więc nie mam potrzeby zabezpieczania hasłami indywidualnych notebooków.
- Dla każdego projektu tworzę oddzielną instancję.
- Gdy projekt jest w trakcie realizacji i wymaga kilku iteracji ja-klient, to korzystam z lokalnego GITa do kontroli wersji. Jeżeli projekt nie wymaga iteracji, to z GITa nie korzystam.
- Gotowe notebooki trzymam lokalnie na zewnętrznym nośniku (serwer) przez określony czas.
Zarejestruj się i dołącz do największej społeczności programistów w Polsce.
Otrzymaj wsparcie, dziel się wiedzą i rozwijaj swoje umiejętności z najlepszymi.