Multiprocesing/Threading , wywolanie funkcji rownolegle i zwrocenie jej wartosci

pain368

2019-03-20 17:41

~~pain368~~2019-03-20 17:41

Rejestracja:około 8 lat
Ostatnio:10 miesięcy
Postów:113

Witam,

potrzebuje podpowiedzi...jak wykonywać traceroute równolegle do np.10 serwisów ? chce żeby każda funkcja kończyła swoje działanie w momencie gdy otrzyma odpowiedz i kończąc swoje działanie dodawała owa odpowiedz do globalnej zmiennej obiektu tablicowego, na której będzie można dalej przetwarzać zwrócone informacje.

Sam threading.Thread działa genialnie, dokładnie tak jak chce, ale nic mi z tego skoro nie mogę przetworzyć zwróconych danych:/. Poniżej to co zrobilem

Kopiuj

url = ["www.google.com", "www.se.pl", "www.fakt.pl"]


 def tracert(domainName):
       array = subprocess.check_output(("traceroute", "{}".format(domainName)))
       return array

process =[]

for iUrl in url: 
    process.append(threading.Thread(target=tracert, args=[iUrl]))

for procStart in process:
    procStart.start()

for procJoin in process:
    procJoin.join()

Widziałem ze mechanizm muliprocessing.Pool działa podobnie, ale na razie nie mogę tego okiełznać :/. Niby dzięki temu funkcja zwraca wartość, ale nie działa to już z taka szybkością jak Thread, a wręcz przeciwnie , nie działa równolegle, a czeka aż pierwsze wywołanie zwróci wartość, a dopiero później zaczyna następne

Dodam, ze system operacyjny to Debian 4.19.20

edytowany 1x, ostatnio: ~~pain368~~ 2019-03-20 17:43

lion137

2019-03-20 18:17

lion1372019-03-20 18:17

Rejestracja:około 8 lat
Ostatnio:około godziny
Postów:4937

Możesz, np użyć futures:

Kopiuj

# concurrent traceroute
import subprocess
from concurrent import futures

url = ["www.google.com", "www.google.pl", "www.google.co.uk"]


def tracert(domainName):
       array = subprocess.check_output(("traceroute", "{}".format(domainName)))
       return array

def tracert_concurrent(urls):
	w = len(urls)
	with futures.ThreadPoolExecutor(w) as executor:
		result = executor.map(tracert, urls)
	return list(result)

def tracert_linear(urls):
	return list(map(tracert, urls))

def main():
	import time
	st = time.time()
	tracert_linear(url)
	en = time.time()
	print("Linear ", en - st) # -> Linear  15.333056449890137
	st = time.time()
	tracert_concurrent(url) # -> Concurrent 5.180043697357178
	en = time.time()
	print("Concurrent", en - st)


if __name__ =='__main__':
	main()

pain368

2019-03-20 20:43

~~pain368~~2019-03-20 20:43

Rejestracja:około 8 lat
Ostatnio:10 miesięcy
Postów:113

Zaraz zbadam, dzięki :)

Shalom

2019-03-26 09:41

~~Shalom~~2019-03-26 09:41

Rejestracja:ponad 21 lat
Ostatnio:około 3 lata
Lokalizacja:Space: the final frontier
Postów:26433

Możesz użyć multiprocessing pool:

Kopiuj

def worker(data):
    return data*2

import multiprocessing

processes=8
pool = multiprocessing.Pool(processes=processes)
data_list = range(10000)
result = pool.map(worker, data_list)
pool.close()
print(result)

To generalnie spawnuje osobne procesy pythona

edytowany 1x, ostatnio: ~~Shalom~~ 2019-03-26 09:41

lion137 2019-03-26 13:09

Kompilując to pypy, mamy pełny paralellizm w Pythonie:) A multiprocessinng = futures.ProcessPoolExecutor.

~~Shalom~~ 2019-03-26 14:31

futures, ło panie, ale to jakiś py3, kto by tego używał :P a odpalenie wielu procesów to i tak plus mimo wszystko, np. jeśli masz interpreter 32bit i trzyma cię jakiś limit pamięci per proces, albo nie ufasz że OS zaalokuje wszystkie zasoby dla wątków jednego procesu

lion137 2019-03-26 17:00

Niedawno Fluent Python czytalem I tam bylo, ze multiprocessing, to nakladka na futures.ProcessPoolExecutor. Moze cos przekrecilem jednak

Liczba odpowiedzi na stronę

Zarejestruj się i dołącz do największej społeczności programistów w Polsce.

Otrzymaj wsparcie, dziel się wiedzą i rozwijaj swoje umiejętności z najlepszymi.

Utwórz konto

Multiprocesing/Threading , wywolanie funkcji rownolegle i zwrocenie jej wartosci

pain368

lion137

pain368

Shalom

Praca dla programistów

Forum dyskusyjne

Sprawy administracyjne

O nas

Skontaktuj się z nami