Introduzione FX Data Mining Lascia per fare un'introduzione semplice e veloce per uno dei campi più interessanti oggi - Data Mining. Vi è un'ampia gamma di applicazioni di data mining. Dobbiamo integrare i modelli di data mining nel nostro trading FX. FX, Forex o il Foreign Exchange FX è il più grande mercato in termini di volume giornaliero scambiato. Ha tre livelli principali di partecipanti: i grandi ragazzi, il livello intermedio e commercianti semplici, come te e me. Ha un carattere speculativo, il che significa che la maggior parte del tempo non ci scambiamo le merci. Abbiamo a cuore solo per la differenza e vogliamo comprare basso e vendere alto o vendere alto e comprare basso. Con le operazioni di brevi o lunghi possiamo guadagnare pips. A seconda del volume di scambio, il valore pip può variare da un centesimo a 10 e più. Questo è il modo principale per fare soldi nel mercato FX (a fianco con carry trade, l'intermediazione, l'arbitraggio e altro ancora). Si noti che il mercato FX è enorme, ma è adatto a tutti i livelli di giocatori. Pensate al mercato FX come un supermercato infinita con un numero infinito di prodotti e clienti, ma ha anche un numero infinito di cassieri. Significato vi è una pari quantità di opportunità per tutti. Data Mining e Machine Learning di data mining è un campo sub maturo di Computer Science. Si trova a circa un sacco di dati ed estrazione non banale di conoscenza utilizzabile da enormi quantità di dati. Il suo fare da trattamento dei dati intelligente utilizzando algoritmi di apprendimento automatico. Data Mining non è solo CRUD (Create, Read, Update e Delete). Abbiamo diversi metodi di data mining. Con la presente i metodi e alcune applicazioni. Classificazione - classificazione e-mail come spam, classificare una transazione come frode. Associazione - YouTube ci suggerisce nuovi video sulla base della nostra storia. Amazon ci propone più elementi durante il checkout. Clustering - analisi dei dati non strutturati, come notizie e opinioni per trovare gruppi comuni economica. Processo di estrazione - esaminare i registri degli operatori delle chiamate al fine di trovare le operazioni inefficienti. Text Mining - notizie mining o analisi tecnica per il riconoscimento. Algorithmic Trading è una esecuzione automatica di un algoritmo di negoziazione. Nel nostro caso, l'algoritmo di negoziazione deriva dall'estrazione. Il trading automatico è fatto da alcuni re di linguaggio di programmazione. La velocità e la robustezza sono i punti chiave qui: operatore umano non può battere il programma informatico per quanto riguarda quegli attributi. Potrebbe essere HFT (High Frequency Trading) e la programmazione a basso livello (come C) o il commercio a lungo termine e la programmazione di alto livello (come Java). Mix Algorithmic Trading con Data Mining di miscelazione di data mining in Trading algoritmico è importante. La cosa più importante è di dati. Un principio semplice afferma che se i dati non è abbastanza buono, i vostri modelli non sarà abbastanza buono (GIGO). E 'tutto sulla creazione di un modello, la sua attuazione e la sperimentazione (come sempre). Attualmente questo flusso è in gran parte manuale. Data Mining Software Ci sono molte opzioni software open source nel settore della Data Mining. WEKA è un framework Data Mining origine nella Università di Waikato, Hamilton, Nuova Zelanda. WEKA è scritto in Java e ha un grande API. Inoltre si dispone di implementazioni per la maggior parte dei ben noti algoritmi di apprendimento automatico. Miscela di buoni strumenti è di vitale importanza. Ci sono troppi modelli di trading possibili. Lanciare una moneta è un sistema di trading stupido, ma è un sistema di trading. Abbiamo bisogno di data mining per trovare l'oro. Buoni strumenti sono facili da ottenere quindi buona fortuna con l'estrazione. Se siete alla ricerca di maggiori informazioni su FX trading scientifico il prossimo passo sta esplorando strumenti di data mining e dati storici. Visita algonell per maggiori dettagli. Ci potete trovare su Twitter. Facebook. Google. LinkedIn e WordPress. Backtesting Data Mining backtesting Data Mining In questo articolo ben diano un'occhiata al due pratiche correlate che sono ampiamente utilizzati dai commercianti chiamati backtesting e Data Mining. Si tratta di tecniche che sono potenti e prezioso, se li usiamo in modo corretto, tuttavia i commercianti spesso li abusano. Pertanto, ben esplorare anche due errori più comuni di queste tecniche, noto come il problema ipotesi multipla e overfitting e come superare queste trappole. Backtesting è solo il processo di utilizzo di dati storici per testare le prestazioni di qualche strategia di trading. Backtesting generalmente inizia con una strategia che vorremmo provare, ad esempio, l'acquisto di GBPUSD quando attraversa sopra i 20 giorni di media mobile e vendere quando attraversa inferiore a quello medio. Ora abbiamo potuto testare questa strategia guardando ciò che il mercato non va in avanti, ma che potrebbe richiedere molto tempo. Questo è il motivo per cui usiamo i dati storici che è già disponibile. Ma aspetta, aspetta ho sentito dire. Potuto imbrogliare o almeno essere di parte perché sai già che cosa è accaduto in passato Questo è sicuramente una preoccupazione, quindi un backtest valida sarà quella in cui si arent familiarità con i dati storici. Siamo in grado di raggiungere questo obiettivo scegliendo periodi di tempo casuali o scegliendo molti diversi periodi di tempo in cui per condurre il test. Ora posso sentire un altro gruppo di voi dicendo, ma tutto ciò che i dati storici appena seduto lì in attesa di essere analizzato è tentati isnt che forse ci sono profondi segreti che i dati che aspettano solo per i geek come noi a scoprirlo. Sarebbe così sbagliato per noi esaminiamo che i dati storici prima, di analizzarlo e vedere se possiamo trovare modelli nascosti all'interno di esso Questo argomento è anche valido, ma ci conduce in una zona irta di pericoli. il mondo di Data Mining Data Mining prevede la ricerca attraverso i dati al fine di individuare i modelli e trovare possibili correlazioni tra le variabili. Nell'esempio di cui sopra che coinvolge il mobile a 20 giorni strategia media, siamo appena arrivati a quel particolare indicatore di punto in bianco, ma supponiamo non avevamo idea di che tipo di strategia abbiamo voluto testare Thats quando il data mining viene in aiuto. Potremmo cercare attraverso i nostri dati storici su GBPUSD per vedere come si è comportato il prezzo dopo che è attraversato molte medie mobili differenti. Potremmo controllare i movimenti di prezzo contro molti altri tipi di indicatori come bene e vedere quelli che corrispondono a grandi movimenti di prezzo. Il tema del data mining può essere controverso perché come ho discusso in precedenza sembra un po 'come barare o guardando avanti nei dati. data mining è una tecnica scientifica valida da un lato il metodo scientifico dice che avrebbero dovuto fare ipotesi e poi testare contro i nostri dati, ma d'altra parte sembra opportuno fare qualche esplorazione dei dati in primo luogo per suggerire un'ipotesi. Così che è giusto possiamo guardare i passaggi nel metodo scientifico per un indizio per la fonte della confusione. Il processo in generale sembra come questo: Avviso di osservazione (dati) Ipotesi Prediction Experiment (dati) che si possa trattare di dati sia durante la osservazione e l'esperimento fasi. Così entrambe le viste sono di destra. Dobbiamo utilizzare i dati in modo da creare una ipotesi ragionevole, ma anche testare questa ipotesi utilizzando i dati. Il trucco è semplicemente quello di fare in modo che le due serie di dati non sono la stessa cosa dobbiamo mai testare la nostra ipotesi utilizzando lo stesso insieme di dati che abbiamo usato per suggerire la nostra ipotesi. In altre parole, se si utilizza il data mining al fine di elaborare idee di strategia, assicurarsi di utilizzare un diverso set di dati di backtest quelle idee. Ora bene rivolgere la nostra attenzione alle principali insidie di utilizzare il data mining e backtesting in modo non corretto. Il problema generale è conosciuta come over-ottimizzazione e preferisco di rompere questo problema in due tipi distinti. Questi sono il problema ipotesi multipla e overfitting. In un certo senso sono modi opposti di rendere lo stesso errore. Il problema ipotesi multipla comporta la scelta di molte ipotesi semplici mentre overfitting comporta la creazione di una ipotesi molto complessa. Il problema ipotesi multipla vedere come questo problema si pone, torniamo al nostro dove ci backtested il movimento strategia media di 20 giorni esempio. Lascia per supponiamo di backtest della strategia contro dieci anni di dati di mercato storici ed ecco indovinate un po 'I risultati non sono molto incoraggianti. Tuttavia, essendo commercianti alti e bassi come siamo, decidiamo di non rinunciare così facilmente. Che dire di una media mobile a dieci giorni che potrebbe funzionare un po 'meglio, così lascia backtest è Corriamo un'altra backtest e troviamo che i risultati arent ancora stellare, ma theyre un po' meglio rispetto ai risultati di 20 giorni. Decidiamo di esplorare un po 'ed eseguire test simili con 5 giorni e 30 giorni medie mobili. Infine si verifica a noi che potremmo in realtà solo testare ogni singolo media mobile fino a un certo punto e vedere come tutti si svolgono. Quindi ci prova il 2 giorni, 3 giorni, 4 giorni, e così via, tutta la strada fino alla media mobile a 50 giorni. Ora certamente alcune di queste medie si esibiranno male e gli altri si esibiranno abbastanza bene, ma ci dovrà essere uno di loro che è il migliore in assoluto. Per esempio potremmo scoprire che la media mobile a 32 giorni si è rivelato essere il miglior interprete durante questo particolare periodo di dieci anni. Questo significa che c'è qualcosa di speciale circa la media di 32 giorni e che dovremmo essere sicuri che esso deve svolgere bene in futuro Purtroppo molti commercianti si presuppone che questo sia il caso, e hanno appena fermare la loro analisi, a questo punto, pensando che theyve scoperto qualcosa di profondo. Essi sono caduti nella trappola multipla Ipotesi problema. Il problema è che non c'è nulla di insolito o significativo per il fatto che alcuni media si è rivelato essere il migliore. Dopo tutto, abbiamo provato quasi cinquanta di loro contro gli stessi dati, in modo da sposare aspettatevi di trovare un paio di buoni esecutori, solo per caso. Esso non significa theres niente di speciale per il particolare media mobile che ha vinto in questo caso. Il problema nasce dal fatto che abbiamo testato diverse ipotesi fino a quando abbiamo trovato uno che ha funzionato, invece di scegliere un solo un'ipotesi e testarlo. Ecco una buona analogia classica. Potremmo venire con una sola ipotesi, come Scott è grande a lanciare teste su una moneta. Da questo, si potrebbe creare una previsione che dice, se l'ipotesi è vera, Scott sarà in grado di capovolgere 10 teste di fila. Poi possiamo eseguire un semplice esperimento per verificare questa ipotesi. Se posso capovolgere 10 teste di fila in realtà pretende dimostrare l'ipotesi. Tuttavia, se non posso compiere questa impresa si smentisce decisamente l'ipotesi. Come facciamo ripetuto gli esperimenti che non riescono a confutare l'ipotesi, allora la nostra fiducia nella sua verità cresce. Quello è il modo giusto per farlo. Tuttavia, quello che se avessimo venire con 1.000 ipotesi invece di solo uno di me di essere un buon flipper moneta Potremmo fare la stessa ipotesi circa 1.000 persone diverse. me, Ed, Cindy, Bill, Sam, ecc Ok, ora permette di testare le nostre molteplici ipotesi. Chiediamo a tutte le 1.000 persone a lanciare una moneta. Ci saranno probabilmente circa 500 che capovolgere la testa. Tutti gli altri possono andare a casa. Ora chiediamo a quelle 500 persone di capovolgere di nuovo, e questa volta circa 250 lancerà teste. Al terzo flip circa 125 persone capovolgere la testa, al quarto circa 63 persone sono lasciati, e il quinto della medaglia ci sono circa 32. Queste 32 persone sono tutti piuttosto sorprendente arent che Theyve tutto capovolte cinque teste di fila Se lanciamo cinque più volte e di eliminare la metà delle persone di volta in volta, in media, si finirà con 16, poi 8, poi 4, poi 2 e, infine, una persona di sinistra che ha capovolto dieci teste di fila. Il suo Bill Bill è un flipper fantabulous di monete o è lui Bene, noi davvero non so, e questo è il punto. Bill potrebbe aver vinto il nostro concorso per puro caso, o si può benissimo essere il miglior flipper di teste questa parte della galassia di Andromeda. Per lo stesso motivo, non sappiamo se il 32 giorni di media mobile dal nostro esempio di cui sopra appena eseguito bene nel nostro test per puro caso, o se c'è davvero qualcosa di speciale. Ma tutto weve fatto finora è quello di trovare una ipotesi, e cioè che il movimento strategia di media a 32 giorni è redditizio (o che Bill è un grande flipper moneta). Abbiamo ricontattato in realtà ancora testato questa ipotesi. Quindi, ora che abbiamo capito che ci hanno né ricontattato davvero scoperto nulla di significativo ancora circa il 32 giorni di media mobile o su fatture capacità di capovolgere le monete, la domanda naturale da porsi è che cosa dovremmo fare dopo Come ho già detto, molti commercianti non si rendono conto che c'è è un passo successivo richiesto affatto. Ebbene, nel caso di Bill youd probabilmente chiedere, Ah, ma riuscirà capovolgere dieci teste di fila di nuovo Nel caso della media mobile 32 giorni, mer desidera verificare nuovamente, ma certamente non contro lo stesso campione di dati che abbiamo usato per scegliere quella ipotesi. Ci sarebbe scegliere un altro periodo di dieci anni e vedere se la strategia ha funzionato altrettanto bene. Potremmo continuare a fare questo esperimento, come tante volte come volevamo fino al nostro fornitura di nuovi periodi di dieci anni ha esaurito. Ci riferiamo a questo come di prove a campione, e il suo modo di evitare questa trappola. Ci sono vari metodi di tali test, uno dei quali è validazione incrociata, ma voleva ottenere in quella più dettagliato qui. Overfitting è davvero una sorta di inversione del problema di cui sopra. Nell'esempio ipotesi più sopra, abbiamo guardato molte ipotesi semplici e scelto quella che i risultati migliori in passato. In overfitting dobbiamo prima guardare al passato e poi costruire un unico complesso ipotesi che si adatta bene con quello che è successo. Per esempio, se guardo il tasso di USDJPY negli ultimi 10 giorni, potrei vedere che le chiude quotidiane fatto questo: su, su, giù, su, su, su, giù, giù, giù, su. Got it vedere il modello Sì, nemmeno io in realtà. Ma se volessi utilizzare questi dati per suggerire una ipotesi, potrei venire con. La mia sorprendente ipotesi: se il prezzo di chiusura sale due volte di fila poi giù per un giorno, o se si va giù per tre giorni di fila ci dovrebbe comprare, ma se il prezzo di chiusura sale tre giorni di fila che dovremmo vendere , ma se si va su tre giorni di fila e poi giù tre giorni di fila che dovrebbe comprare. Huh Suona come un diritto ipotesi sgargianti Ma se avessimo usato questa strategia nel corso degli ultimi 10 giorni, ci sarebbe stato proprio su ogni singolo commercio abbiamo fatto la overfitter utilizza backtesting e data mining in modo diverso rispetto alle molteplici produttori di ipotesi fanno. Il overfitter doesnt venire con 400 diverse strategie di backtest. In nessun modo la overfitter utilizza strumenti di data mining di capire una sola strategia, non importa quanto complessa, che avrebbe avuto la migliore performance nel corso del periodo di backtesting. Funzionerà in un futuro non probabile, ma potremmo sempre tenere tweaking il modello e testare la strategia in diversi campioni (di prova a campione di nuovo) per vedere se il nostro prestazioni migliorano. Quando smettiamo di ottenere miglioramenti delle prestazioni e l'unica cosa questo è in aumento è la complessità del nostro modello, allora sappiamo weve attraversato la linea in sovradattamento. Quindi, in sintesi, weve visto che data mining è un modo per utilizzare i nostri dati sui prezzi storici per suggerire una strategia di trading praticabile, ma che dobbiamo essere consapevoli delle insidie del problema ipotesi multipla e overfitting. Il modo per fare in modo che noi non cadere preda di queste trappole è di backtest nostra strategia utilizzando un insieme di dati diverso da quello che abbiamo usato durante la nostra esplorazione di data mining. Noi comunemente riferiamo a questo come di controlli a campione. Un problema con data mining è che gli operatori tendono ad usare diversi tipi di filtri per la ricerca di un modello. Il problema è che ogni segnale è composto dai diversi segnali sinusoidali, in modo che quando l'applicazione di filtri diversi per un segnale ci sarà di sicuro finire con un modello. Un sacco di studi è stato fatto sul modello di prezzo, per lo più si basano su data mining, la questione sarà il presupposto che lo specchio futuro il passato, la risposta è forse. Abbiamo la possibilità 5050. la percentuale può studiando questo modello su dati diversi. Se neanche voglia di aumentare tale percentuale abbiamo bisogno di sapere quale sia la causa di questo modello è, conoscendo la causa di questo motivo avremmo un vantaggio nel commercio. Per esempio io farò questo presupposto, let8217s dire che il primo Venerdì di ogni mese a causa della notizia un sacco di commercianti tendono a uscire dalla loro commerci al mattino prima che la notizia e inserire di nuovo dopo la notizia, per cui vi è un modello di vendita e l'acquisto ad una certa ora. potremmo utilizzare queste informazioni per nostro beneficio mediante l'applicazione di una sorta di scambio di copertura così entriamo sia con comprare e vendere prima che la notizia. poi, dopo la notizia vendiamo soltanto per chi vuole comprare e didn8217t vuole tenere una posizione durante la notizia e lasciamo che il buy finché il prezzo ritorna, questo potrebbe essere applicato a tasso di interesse SAWP, o un'altra configurazione 8230 bla bla. questa è solo una teoria. Io lo utilizzo per dire che la paura e l'avidità ha un tempo sul mercato. Quindi, ciò che crea i modelli di prezzo sono la paura e l'avidità, ora se isoliamo il modello e conosciamo la causa alla base di questo modello, come nel precedente esempio, la paura dalla notizia o risolvere il conto alla fine del mese. Cose così. allora potremmo in teoria prevedere il futuro primo due post vengono copiati da questo sito tutti gli articoli da Scott Percival sono la pena di leggere eccellente MiniMe Discussione unirsi a noi scaricare MetaTrader 5 Copyright 2000-2016, MQL5 Ltd. Data Mining una strategia Majors Forex A causa di le caratteristiche uniche di coppie di valute diverse, molte strategie di Forex quantitativa sono progettati con una coppia di valute specifico in mente. Anche se questo può produrre molti strategie di trading redditizi, ci sono anche vantaggi per lo sviluppo di strategie che possono essere scambiati tra più coppie di valute. Questo introduce un elemento di diversificazione in grado di fornire un ulteriore livello di protezione al ribasso. Daniel Fernandez ha recentemente pubblicato un sistema che ha progettato per il commercio su ciascuno dei quattro major Forex. Il suo obiettivo era quello di trovare un sistema che avrebbe prodotto un 20 anni track record di scambio proficuo su EURUSD, GBPUSD, USDJPY, USDCHF e. Daniel utilizza un approccio di data mining per sviluppare una strategia per la negoziazione dei quattro major Forex. Per costruire il suo sistema, Daniel utilizzato il suo software data mining per definire segnali di ingresso e di uscita che hanno prodotto una strategia commerciale vantaggioso su ciascuna delle quattro coppie di valute negli ultimi 20 anni. Quello che gli viene in mente è una combinazione di tre regole basati sul prezzo che costituiscono il fondamento della sua strategia Forex Majors. Daniel8217s strategia Forex Majors Strategia Forex Daniel8217s Majors è molto semplice in quanto ha sempre una posizione, sia lungo o corto, in ognuna delle quattro coppie di valute che commercia. Si basa tutti i suoi scambi su grafici giornalieri. La strategia va lungo quando sono soddisfatte le seguenti tre condizioni: La strategia va breve quando sono soddisfatte le seguenti tre condizioni: Come si può vedere, la strategia è fondamentalmente una tendenza ottimizzato seguente strategia. Questo ha senso, perché Daniel afferma all'inizio del suo articolo che tendenza a lungo termine seguenti strategie sono generalmente le migliori strategie per la negoziazione più mercati. Una regola aggiuntiva che la strategia Daniel8217s fa uso di è una stop-loss ATR-based. La stop-loss fisso è fissato a 180 della 20 giorni di ATR. Se viene attivato il stop-perdita, la strategia rimane fuori dal mercato fino a quando un segnale viene generato nella direzione opposta. Test indica che rientrare in un segnale nella stessa direzione prestazioni influenzati negativamente. Backtesting Performance Il backtesting risulta che Daniel incluso nel suo post mostrano che la strategia era molto redditizio. Ha prodotto un rapporto di vincita di 45, un fattore di profitto di 1,38, e una ricompensa al rapporto di rischio di 1,68. Daniel8217s più grande preoccupazione per la strategia era che il periodo massimo drawdown ha rappresentato un tempo molto lungo. Secondo i numeri Daniel8217s, il rendimento medio annuo è stato 9.67. Questa consisteva di 16 anni proficui, 4 anni che perdono, e un anno che in fondo pareggio. L'anno migliore è stato un ritorno di 37.76, e l'anno peggiore è stato una perdita di 20,2. Daniel osserva che questo sistema non rappresenterebbe una buona strategia stand-alone a causa dei suoi rendimenti relativi ai prelievi massimi. Tuttavia, egli suggerisce che potrebbe essere un interessante pezzo di una più grande, strategia multi-sistema. Wait Se avete bisogno di ulteriori informazioni per vedere come TradeMiner può aiutare nel tuo trading. TradeMiner software identifica storiche stagionali tendenze e cicli di mercato una metodologia scientificamente documentato: regolare i criteri per ottenere risultati immediati di tendenze storiche di scansione per le tendenze storiche di stagione è semplicemente fatto interagendo con il paragrafo come indicato sopra. Ricerca di tendenze per mese o per un simbolo specifico Definire la precisione storica minima (es. 80 percentuale storica vittoria più di dieci anni significherebbe almeno 8 degli ultimi 10 anni avrebbe dovuto essere stato in linea con l'andamento stagionale.) Stretto o espandere i giorni di negoziazione. Questo indica la durata del numero di giorni in cui si desidera che la tendenza ad essere (es. 15 giorni di negoziazione a 45 giorni di negoziazione è alla ricerca di tendenze che durano tre settimane per nove settimane.) Selezionare il numero di anni per guardare indietro. Questa opzione permette di impostare il numero minimo di anni TradeMiner guarderà indietro per trovare le tendenze storiche. Filtri estirpare le tendenze sovrapposte (tendenze cioè che partono lo stesso giorno, ma finiscono in giorni diversi o se si sovrappongono affatto.) Selezione Dig Ora esegue la scansione attraverso il database storico e identificare le tendenze e cicli che soddisfano i criteri. TradeMiner sarà classificare i risultati storici in base a un sistema di classificazione proprietario. Questo sistema ranghi più elevati le scelte con i maggiori benefici storiche nel più breve lasso di tempo, con il minimo di rischio storico. La classifica punteggio lavora su una scala da zero a cinque, e comprende una chiave di facile lettura, con codice colore. Analizzare i grafici La varietà di grafici in TradeMiner consente di vedere i risultati degli anni precedenti, identificare il rischio storico vs ricompensa e vedere i registri commerciali dettagliate dei precedenti anni tendenze. Visivamente vedere l'andamento storico e visualizzare i risultati degli anni passati. In TradeMiner è possibile selezionare una qualsiasi delle seguenti tabelle e saranno visualizzati nella parte bassa della grande finestra Chart. Questa visione più ampia fornisce e dettagli aggiuntivi per qualsiasi commercio prescelto. Storico azionario Grafico rischio storico vs Reward Anno per anno commerciale Dettagli
No comments:
Post a Comment