Korygowanie wykresu

Korygowanie wykresu
Beata Griškevič
  • Rejestracja:około 8 lat
  • Ostatnio:ponad 5 lat
  • Postów:40
0

Witam. Mam tu kod programu, który wyświetla mi wykres (x - data, y - cena). W załączniku jest zdjęcie tego, co otrzymuje (oraz dane na wszelki wypadek).

Czy ktoś wie, jak można go pokorygować, by tej części, którą oznaczyłam czarnym prostokątem na zdjęciu, pozbyć się, tzn. zrobić wykres bardziej estetycznym w tej części? Z góry dziękuję! :)

Kopiuj
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import matplotlib.patches as mpatches
import matplotlib.dates as dates

def pc_Ind(file, N):
    data_pd = pd.read_csv(file, parse_dates=[['Date','Time']])
    format = '%m/%d/%Y %H:%M'
    data_pd = data_pd.set_index(data_pd['Date_Time'])
    data_pd['Date_Time'] = pd.to_datetime(data_pd['Date_Time'], format=format)
    data_pd = data_pd.set_index(data_pd['Date_Time'])
    data_pd = data_pd.drop(columns='Date_Time')
    ub = np.zeros(data_pd.shape[0])
    lb = np.zeros(data_pd.shape[0])
    for i in range(N - 1, data_pd.shape[0]):
        ub[i] = np.max(data_pd['Close'][i-N+1:i+1])
        lb[i] = np.min(data_pd['Close'][i-N+1:i+1])
    fig = plt.figure(figsize=(10, 5))
    fig.add_axes()
    ax = fig.add_subplot(111)
    ax.xaxis.grid(True, which='minor')
    appl = mpatches.Patch(color='blue', label='Apple data')
    upb = mpatches.Patch(color='yellow', label='PC indicator (upper)')
    lwb = mpatches.Patch(color='red', label='PC indicator (lower)')
    plt.legend(handles=[appl, upb, lwb])
    plt.plot(data_pd.index, data_pd['Close'],'b')
    plt.plot(data_pd.index, ub + 5, 'y') 
    plt.plot(data_pd.index, lb - 5, 'r')
    plt.plot(data_pd.index, np.zeros(data_pd.shape[0]),'g')
    ax.set(title='Apple', ylabel='Close price', xlabel='Datetime')
    date_formatter = dates.DateFormatter('%m/%d/%Y')
    ax.xaxis.set_major_formatter(date_formatter)
    ax.xaxis.set_major_locator(dates.DayLocator(interval=40))
    plt.setp(ax.xaxis.get_majorticklabels(), rotation=90, fontsize=7)
    fig.autofmt_xdate()
    ax.autoscale_view()
    plt.grid()
    plt.show()
    return data_pd

pc_Ind('appl.csv', 14)

#Upper Band = Highest price in the last n periods
#Lower Band = Lowest price in the last n periods

edytowany 2x, ostatnio: Beata Griškevič
superdurszlak
  • Rejestracja:prawie 7 lat
  • Ostatnio:dzień
  • Lokalizacja:Kraków
  • Postów:2000
1
Kopiuj
    ub = np.empty(data_pd.shape[0])
    lb = np.empty(data_pd.shape[0])
    for i in range(N - 1, data_pd.shape[0]):
        ub[i] = np.max(data_pd['Close'][i-N+1:i+1])
        lb[i] = np.min(data_pd['Close'][i-N+1:i+1])

Dla danych z zakresu i = 0...N-2 nie wstawiasz nic więc masz tam zera którymi zainicjalizowałaś ndarray'sy ;)

Wystarczy zainicjalizować ndarray wartościami np.nan które na wykresie zostaną pominięte:

Kopiuj
    ub = np.full(data_pd.shape[0], np.nan)
    lb = np.full(data_pd.shape[0], np.nan)
    for i in range(N - 1, data_pd.shape[0]):
        ub[i] = np.max(data_pd['Close'][i-N+1:i+1])
        lb[i] = np.min(data_pd['Close'][i-N+1:i+1])

Efekt:

screenshot-20181028200632.png


Beata Griškevič
  • Rejestracja:około 8 lat
  • Ostatnio:ponad 5 lat
  • Postów:40
0

Jak można pokazać ten sam wykres, ale od roku 2018?

Guaz
Zrób prosty debug, jakiego typu jest zmienna która posiada u ciebie datę. Jeśli to na przykład obiekt datetime, wystarczy usunąć je z rozpatrywanego zbioru który przekazujesz do wykresu wraz z powiązanymi rozwiązaniami, prostym if'em lub czymś tego rodzaju :)
superdurszlak
Żadnych ifów, po to jest indeksowanie, loc/iloc i cała reszta :)
Guaz
@superdurszlak Oczywiście, indeksowanie od elementu (bądź jak kto woli pracowanie na fragmentach) to najlepsza metoda pod względem optymalizacji kodu przy dużych zbiorach. Nie wiem jak to się odbywa w loc/iloc, ale podejrzewam że siedzi tam binary search lub podobny algorytm który też jest dobrym pomysłem, a na pewno lepszym od if'a. To taka najprostsza linia oporu, chociaż może faktycznie powinienem pisać też o bardziej zaawansowanych możliwościach dla ambitnych :).
superdurszlak
Ale to jest prostsze od ifozo-pętlozy ;)
Guaz
Wszystko jest proste, czasem tylko pracochłonne ^^. Pod warunkiem że to umiesz :D. Na szczęście koła na nowo nie trzeba wynajdywać, bo są gotowe elementy :).
superdurszlak
  • Rejestracja:prawie 7 lat
  • Ostatnio:dzień
  • Lokalizacja:Kraków
  • Postów:2000
1
Beata Griškevič napisał(a):

Jak można pokazać ten sam wykres, ale od roku 2018?

Nie pamiętam dokładnie jak to wyglądało składniowo, ale możesz użyć czegoś w tym rodzaju na samym początku aby odfiltrować tylko te rekordy które mają wartość 'date' po zadanej dacie

Kopiuj
df = df[df['date'] > jakas_data]

Ew. analogiczna operacja z wykorzystaniem pd.DataFrame.loc


edytowany 1x, ostatnio: superdurszlak

Zarejestruj się i dołącz do największej społeczności programistów w Polsce.

Otrzymaj wsparcie, dziel się wiedzą i rozwijaj swoje umiejętności z najlepszymi.