jakich programów brakuje? (czyli nie istnieją)

0

Jakich programów wam brakuje? czyli takich, których nikt nie stworzył, choć przydałoby się, by były.

Ja np. chciałbym program z rozpoznawaniem mowy, który działa w ciekawy sposób. Przykład:
leżę sobie w łóżku ze słuchawkami na łbie i przy zgaszonym świetle słucham audiobooka, w pewnym momencie jest bardzo ciekawy fragment więc mówię do mikrofonu "zatrzymaj", "przewiń 30 sekund", "włącz" (tu upewniam się, że to dobry fragment), "zatrzymaj, przewiń 5 sekund", "ustaw początek cięcia pliku mp3", "przewiń do przodu o 30 sekund i zatrzymaj. Ustaw koniec cięcia pliku mp3", "zapisz zaznaczony fragment na pulpicie, nazwa plik1", "wznów" (i wracam do słuchania audiobooka dalej).

To jest losowy przykład możliwości. Po prostu chodzi o to, żeby program rozumiał mnie na tyle dobrze, że przy wyłączonym monitorze mógłbym operować na komputerze, ciąć pliki mp3, zapisywać tekst (notatki jakieś, bo np. w nocy przypadkiem wpadnę na jakiś pomysł, a nie chce mi się podbiegać do rażącego w oczy o 3 w nocy monitora). Mnóstwo możliwości.

Z urządzeń związanych z komputerem, to przydałyby się miniaturowe, tanie słuchawki bezprzewodowe, takie, że leżąc w łóżku na boku i przyciskając łeb do poduszki, mógłbym wygodnie słuchać czegoś. Mogłyby być też wodoodporne, można by brać prysznic wtedy w nich i gdyby miały dodatkowo mikrofon, można by sterować komputerem, kazać włączyć mu radio lub piosenkę jakąś lub sprawdzić pocztę, albo wiadomości na GG (syntezator by czytał).

Brakuje mi też porządnego translatora. Dzisiejszy google translate jest dość słaby, przykładowo wklepcie w nim adres jakiejś chińskiej, japońskiej, arabskiej, perskiej, indyjskiej lub innej strony i niech wam przetłumaczy newsa, czy artykuł z tej strony. Tłumaczenie będzie kiepskie, mało zrozumiałe, nawet jeśli to news ze strony typu tvn24. Mam nadzieję, że za 10 lat będą jakieś porządne translatory. Rozpoznawanie mowy na youtube też by się przydało lepsze, bo w chwili obecnej jest marne (czyli filmik angielski i chcemy angielskie napisy), na tyle marne, że nie opłaca się tego używać.

A wam czego z programów brakuje?

0

Narzekasz na translator Googla, nieźle. Sprawdź sobie binga :D
W tej kwestii wymagasz za wiele na mnie. Sam widzisz ile języków oferuje translator. I chciałbyś perfekcyjne tłumaczenie z każdego na każdy? No to sobie poczekasz.
Za to Niemiecki<>Angielski jest wybitny, nawet na tekstach piosenek, PL<>EN działa zadziwiająco dobrze jak na automat, tak samo nawer RU<>PL. Zapewne wiele innych języków także (a np. fiński to porażka, ale tu się nie dziwię, ze względu na to jak w fińskim odmienia się słowa).
Niemniej jednak nie uważam, że translator ma odrobić za Ciebie zadanie z języka obcego - a pomóc zrozumieć czy przetłumaczyć tekst.

Sterowanie głosem teoretycznie istnieje od lat - jakoś tylko nikt nie kwapi się na głębszą implementację. Nie wiem czemu, nie wgłębiam się. Nawet kilkuletnie Nokie potrafią rozpoznawać polecenia (nie po powtórzeniu nagrania tylko wg słów angielskich), w Win Vista możesz dyktować tekst do Worda (po ang) bez dodatkowego oprogramowania. Po co Ci ciąć empetrójki słowami to nie wiem.

Syntezatory działają perfekcyjnie od lat, to chyba wiesz.

Sam wymagań nie mam. Dla mnie wszystko jest w porządku i komputera też pod prysznic brać nie potrzebuję. Pewnie jeszcze kiedyś stworzy się narzędzia, które coś mi tam ułatwią pracę/życie [przynajmniej w teorii], ale dopóki ich nie ma - też nie narzekam.

1

Android ma funkcję rozpoznawania mowy (wymaga połączenia internetowego), działa ona zadziwiająco dobrze (czasem dyktuję SMSy) - zapewne wszystko opiera się na zwykłym uploadowaniu mp3 z nagranym głosem na serwer i otrzymywaniu odpowiedzi. Zapewne wszystko jest gdzieś udokumentowane, napisać program na Windows w oparciu o to nie byłoby ciężko. Tylko właśnie, skoro już o Androidach mówimy - nie lepiej by Ci było po prostu kupić smartfona? :>

0

wiem, że obecnie są programy, które rozpoznają mowę całkiem dobrze (nawet polską), tyle, że żaden z nich nie potrafi wykonywać poleceń na takiej zasadzie, że wyłączam sobie monitor (lub jestem niewidomy) i mówię coś, a program to robi dobrze (odpalić firefoxa, czy coś podobnego odpali i tekst można podyktować, ale coś więcej już nie bardzo i mówię tu o wyłączonym monitorze, bo przy włączonym monitorze, to można kazać kursorem klikać na ekranie w precyzyjnych miejscach, dlatego, że taki program poleceniem głosowym potrafi narysować siatkę ponumerowaną, gęstą, rzadką itd i można by napisać post na forum klikając nawet w ikonki do pogrubienia tekstu i inne).
Zresztą znacie filmy i baki, w których jest jakiś komputer, który rozumie tyle co człowiek mniej więcej i wykonuje zaawansowane rzeczy bez problemu, bo na filmie taki komputer nie czyta poleceń na zasadzie komenda składająca się ze słowa lub kilku równająca się konkretnej funkcji, tylko gadasz do kompa, tak jak do dziecka i dziecko wie o co chodzi i wykonuje to. Oczywiście aż tak zaawansowanego programu bym nie oczekiwał, ale chciałbym by programy do rozpoznawania mowy, można było skonfigurować dobrze pod konkretne programy i później wydawałoby się polecenie np. "włącz foobar", "foobar przejdź do Zakładka 3", "foobar zaznacz pierwszą piosenkę", "foobar włącz piosenkę", "foobar pauza", "foobar wznów" (podobnie z cięciem mp3 w jakimś programie itd i zapisywaniem pliku na np. pulpit w folderze "zapisane").

Gdybym do delphi dostał cokolwiek, co rozpoznaje mowę (angielska wystarczy) i byłoby to łatwe w użyciu, to napisałbym program do rozpoznawania mowy dla ludzi zupełnie za darmo i dołączyłbym do niego proste, darmowe programy (które też bym napisał specjalnie do tego rozpoznawacza mowy). Można by wtedy leżeć w łóżku, słuchać audioksiążek lub muzyki i zatrzymywać odtwarzanie, cofać, wznawiać, czy przechodzić do innej zakładki z piosenkami bez wstawania z łóżka. Można by też tak zrobić specjalny program do czytania rss, czy czegoś z popularnej strony jak wykop.pl. Setki pomysłów. (słyszałem coś kiedyś o SAPI microsoftu, ale nie szukałem informacji, czy proste to w użyciu pod delphi. Wiecie coś o tym, może ktoś z was siedział w tym temacie? lub jakieś alternatywy dla tego pod delphi?)

12

Gdybym do delphi dostał cokolwiek, co rozpoznaje mowę (angielska wystarczy) i byłoby to łatwe w użyciu, to napisałbym program do rozpoznawania mowy dla ludzi

Czyli jak dostaniesz program do rozpoznawania mowy to napiszesz program do rozpoznawania mowy?

1

Dla niewidomych nie ma sensu stawiania przed nosem systemu "z myszką" - jak ma niewidomy wytłumaczyć kliknij teraz na ten przycisk później wpisz to słowo w to pole edycyjne tylko uważaj na walidacje strony.
Lepsze było by zintegrowanie np. konsoli z syntezatorem mowy, np. pokaż katalogi bieżące, wyszukaj aplikacji, uruchom to i to. Później komputer opisuje co się wydarzyło, recytuje możliwe akcje do dialogu np. tak/nie/ponów/pomiń/ nast. akapit. Niestety do tego trzeba by wręcz napisać dedykowany system z aplikacjami wspierającymi takie rzeczy, zrobić "internet" od nowa. Teraz systemy/aplikacje budowane są tak aby operować wszystkimi zmysłami.
Podobnie z tym cięciem MP3 - trudno mi sobie to wyobrazić, więcej zamieszania niż to warte, może lepiej sobie kupić pilota i go oprogramować.
Wypowiedzenie komendy trwa, mówisz cofnij dwie sekundy i zareaguje po 3, przewijając też raczej wzrokowo szacujemy miejsca, do którego ma cofnąć utwór.
Sztuczna inteligencja jaka jest każdy widzi raczej się to szybko nie zmieni poza tym ciężko jest nam ludziom zrozumieć siebie nawzajem a co dopiero oczekiwać tego po algorytmach stworzonych przez niego samego.

0
Rev napisał(a):

Gdybym do delphi dostał cokolwiek, co rozpoznaje mowę (angielska wystarczy) i byłoby to łatwe w użyciu, to napisałbym program do rozpoznawania mowy dla ludzi

Czyli jak dostaniesz program do rozpoznawania mowy to napiszesz program do rozpoznawania mowy?

nie uproszczaj tak. Dostanę coś gotowego, co rozpoznaje mowę i zaprogramuję to, by wykonywało konkretne czynności + dodatkowe programy różnego typu, przystosowane konkretnie pod mowę, a nie pod myszkę. + może zobaczyłbym, czy dałoby radę sensownie wykorzystać gotowe programy, wyglądałoby to tak, że uruchamiasz raz dowolny program, następnie wpisujesz w programie moim polecenie jakieś i wtedy w tym innym programie wskazujesz pozycję przycisku, który ma kliknąć po wydaniu tej komendy (lub możliwość przytrzymania przycisku i przesunięciu go o x pixeli, dzięki czemu można by np. ściszyć coś, jeśli program nie obsługiwałby ściszania skrótem, ale to przykład tylko). Pomysłów tysiące.

@szopenfx
a to pisałem o klikaniu myszką na ekranie, było o programach, które obecnie istnieją i są ograniczone w ten sposób, że wyświetlają siatkę z numerkami i dzięki temu możesz precyzyjnie klikać we wszystko na ekranie, ale warunek to patrzenie na monitor. Ja oczywiście chcę, by był program, który przy wyłączonym monitorze dużo zrobi.

0

Zresztą znacie filmy i baki, w których jest jakiś komputer, który rozumie tyle co człowiek mniej więcej i wykonuje zaawansowane rzeczy bez problemu, bo na filmie taki komputer nie czyta poleceń na zasadzie komenda składająca się ze słowa lub kilku równająca się konkretnej funkcji, tylko gadasz do kompa, tak jak do dziecka i dziecko wie o co chodzi i wykonuje to

Łoho, tylko nie to! Przecież znasz filmy? Odyseję kosmiczną widziałeś?
Z resztą w Alienie np. aż pięknie widać, że komputer działa na algorytmy - reaguje na konkretne słowa kluczowe i Ripley musi zapytać kilka razy na różne sposoby, by uzyskać odpowiedź, o której jej chodziło.

Aby komputer "rozumiał", o co ci chodzi, trzeba by rozwinąć sztuczną inteligencję. A dziedzina ta, na dzień dzisiejszy, niestety inteligencji wcale nie przypomina. Śmiem twierdzić, że nie dojdziemy w tej dziedzinie dużo dalej, bez gruntownej zmiany architektury komputera jako takiego. Toć teraz to jest zwykła, głupia maszyna licząca.

Póki nie mamy prawdziwej sztucznej inteligencji, pozostaje jedynie wytłumaczenie komputerowi konkretnych poleceń. Jak ktoś potrzebuje mieć konkretne polecenie, to je sobie zapewne oprogramowuje. Większość ludzi nie widzi zastosowania i preferuje klawiaturę/myszkę, dlatego też nie powstają programy powszechnego użytku sterowane głosem (poza zwykłym dyktowaniem tekstu, które faktycznie znalazło zastosowanie choćby w pisaniu smsów).
Także jak masz takowy pomysł, no to na co czekasz - do dzieła! Gwarantuję ci, że nikt ci nie napisze ogólnej, wszechstronnej, wielojęzykowej biblioteki do rozumienia wszystkiego ;)

0

Z urządzeń związanych z komputerem, to przydałyby się miniaturowe, tanie słuchawki bezprzewodowe, takie, że leżąc w łóżku na boku i przyciskając łeb do poduszki, mógłbym wygodnie słuchać czegoś

Polecam membranowe, takie mniejsze, wkladane do ucha. Tez mialem ten problem, kupiłem takie i mam spokoj ;d

0

Ja tam nie polecam rozwiązania @Legalnl, takie słuchawki strasznie słabo przenoszą niskie pasma (mam wrażenie, że coś znośnego z tego typu albo nie istnieje, albo jest cholernie drogie). Nie wiem jak inni, ja nie jestem w stanie słuchać niczego mocniejszego na czymś takim.

1 użytkowników online, w tym zalogowanych: 0, gości: 1