Tuesday 21 February 2017

Intraday Haute Fréquence Forex Trading Avec Adaptive Neuro Fuzzy Inférence Systèmes

Le présent article introduit un système d'inférence neuro-floue adaptatif (ANFIS) pour le négoce financier, qui apprend à prédire les mouvements de prix à partir de données de formation consistant en intraday Tick ​​échantillonnées à haute fréquence. Les données empiriques utilisées dans notre enquête sont des séries chronologiques de prix moyens de cinq minutes sur les marchés des changes. L'optimisation ANFIS implique des back-testing ainsi que la variation du nombre d'époques, et est combinée avec une nouvelle méthode de capture de la volatilité en utilisant une approche événementielle qui prend en compte les changements directionnels dans les seuils pré-spécifiés. Les résultats montrent que le modèle proposé surperforme les stratégies standard telles que buy-and-hold ou la prévision linéaire. Téléchargements: (lien externe) indersciencelink. phpid38529 (texthtml) L'accès au texte intégral est réservé aux abonnés. Oeuvres connexes: Cet article peut être disponible ailleurs dans EconPapers: Recherche des articles du même titre. Plus d'articles dans International Journal of Financial Markets and Derivatives de Inderscience Enterprises Ltd Données de la série mises à jour par Darren Simpson (). Ce site fait partie de RePEc et toutes les données affichées ici font partie de l'ensemble de données RePEc. Votre travail manque-t-il à RePEc Voici comment contribuer. Questions ou problèmes Consultez la FAQ d'EconPapers ou envoyez un courrier à. Transactions de devises à fréquence élevée à l'infini avec des systèmes d'inférence neuro-flous adaptatifs. Abdalla Kablan et Wing Lon Ng Transcription 1 68 Int. J. Marchés financiers et produits dérivés, vol. 2, no 12, 2011 Le marché des changes à haute fréquence intraday avec des systèmes d'inférence neuro-floue adaptatifs Abdalla Kablan et Wing Lon Ng Centre pour les finances et les agents économiques (CCFEA), Université d'Essex, Wivenhoe Park, Colchester, CO4 3SQ, Royaume-Uni Résumé: Cet article introduit un système d'inférence neuro-floue adaptatif (ANFIS) pour le commerce financier, qui apprend à prédire les mouvements de prix à partir de données de formation consistant en données de tique intraday échantillonnées à haute fréquence. Les données empiriques utilisées dans notre enquête sont des séries chronologiques de prix moyens de cinq minutes sur les marchés des changes. L'optimisation ANFIS implique des back-testing ainsi que la variation du nombre d'époques, et est combinée avec une nouvelle méthode de capture de la volatilité en utilisant une approche événementielle qui prend en compte les changements directionnels dans les seuils pré-spécifiés. Les résultats montrent que le modèle proposé surperforme les stratégies standard telles que buy-and-hold ou la prévision linéaire. Mots-clés: négociation de transactions à haute fréquence système d'inférence neuro-floue adaptatif ANFIS marchés de change stabilité saisonnière intraday. La référence à ce papier doit être faite comme suit: Kablan, A. et Ng, W. L. (2011) Intraday haute fréquence FX trading avec des systèmes adaptatifs d'inférence neuro-floue, Int. J. Marchés financiers et produits dérivés, vol. 2, Nos 12, pp Notes biographiques: Les intérêts de recherche d'Abdalla Kablan comprennent l'intelligence artificielle et ses applications dans l'ingénierie financière. Ses recherches portent également sur les applications des systèmes heuristiques et neuro-flous pour la prise de décision financière. Wing Lon Ng est un conférencier en finances à haute fréquence. Ses intérêts de recherche comprennent l'économétrie financière et la finance informatique et leurs applications dans l'analyse empirique de la microstructure du marché. 1 Introduction Les investisseurs et les négociants financiers ont toujours tenté de prévoir le mouvement des marchés boursiers (par exemple Schulmeister, 2009). Le commerce financier lui-même s'inscrit dans une structure complexe, non seulement impliquant la dynamique de la formation des prix mais aussi la microstructure du marché elle-même. Les informations sur le marché, les nouvelles et les facteurs externes influent sur les décisions commerciales des investisseurs concernant l'achat et la vente. Habituellement, le modèle de prix est difficile à reconnaître, à signaler ou à catégoriser, quel que soit le type du marché financier réel. (2) Le marché des changes à haute fréquence intraday avec ANFIS 69 a étudié (Murphy, 1986). Cet article présente un modèle qui tente de prouver que l'intelligence artificielle et le soft computing tels que le système adaptatif d'inférence neuro-floue (ANFIS) peuvent fournir une solution majeure dans ces tâches. L'approche logique floue, inspirée d'un modèle de raisonnement humain dans lequel les termes linguistiques sont utilisés et de quantités floues (par opposition à la netteté) sont manipulées, est combinée dans les systèmes neuro-flous avec la capacité de reconnaissance des modèles des réseaux neuronaux (voir Konstantaras et al. 2006 Sewell, 2010). La récente escalade de la puissance informatique a entraîné une augmentation considérable de la disponibilité des données et des informations. Les ordinateurs, les capteurs et les canaux d'information se développent plus rapidement et les données sont plus faciles à collecter que jamais. En raison de la disponibilité en temps réel des carnets de commandes de nos jours, la différence dans la prise de décision et la prise de risque parmi les différents commerçants représente un processus complexe qui affecte les conditions du marché. Le négoce à haute fréquence est une nouvelle discipline dans le commerce financier où les tendances sont analysées en mode tick-by-tick et les décisions d'achat et de vente sont prises en conséquence. Par conséquent, la mise en place d'un système permettant de saisir et de prévoir les mouvements du marché au niveau temps réel contribuerait à améliorer le bilan financier des investisseurs (voir Dacarogna et al., 2001, Dempster et Jones, 2001). Ce document propose une nouvelle technique de traitement et de filtration informatique qui n'a pas encore été entièrement discutée ou mise en œuvre dans la littérature existante pour une récente étude sur les stratégies de négociation algorithmique et les systèmes de négociation, voir Aldridge (2009), Schulmeister (2009), Yeh et al. (2011) et leurs références. Traditionnellement, la plupart des algorithmes de prédiction présentés dans la littérature se concentrent sur l'exploration de données, c'est-à-dire l'intégration de statistiques, les paradigmes d'apprentissage mécanique et l'analyse de systèmes dynamiques (par exemple Hellstrom et Holmstroumlm, 1998 Kasabov et Song, 2002). En outre, étant donné que les séries temporelles financières sont souvent très bruyantes, un processus de filtrage devrait supprimer ce bruit du signal (Sheen, 2005). Une architecture ANFIS a été choisie pour ce système de trading automatisé car elle présente des performances très élevées dans la modélisation de fonctions non linéaires et dans l'identification de composants non linéaires (Denaiuml et al., 2007). Le projet d'ANFIS financier utilise un algorithme d'apprentissage hybride et est capable de construire une cartographie d'entrée-sortie unique basée à la fois sur les connaissances humaines (règles floues) et sur les paires de données d'entrée-sortie stipulées (Castillo et al., 2006). Il a également montré d'excellents résultats dans la prévision de séries chronologiques (voir Jang, 1993 Kasabov et Song, 2002). De plus, étant donné que le système de négociation traite des données intraday, les données entrées dans le système doivent être désajustées d'une manière spécifique afin de séparer la composante déterministe dans la série temporelle car sinon elle introduirait une autocorrélation spontanée. La désaisonnalisation est effectuée en utilisant une nouvelle mesure de la volatilité basée sur les événements (Glattfelder et al., 2010). Le rappel de l'article est organisé comme suit. La section 2 présente la méthodologie. La section 3 présente les données empiriques et les résultats. La section 4 conclut. 2 Méthodologie Dans la suite, la section 2.1 décrit d'abord la conception et l'architecture de l'ANFIS initialement introduit par Jang (1993). La section 2.2 développe ensuite l'utilisation d'ANFIS pour les opérations financières. La section 2.3 introduit une mesure de la volatilité fondée sur les événements qui doit être introduite dans l'ANFIS afin de saisir la saisonnalité intraday et d'optimiser le calendrier de négociation. 3 70 A. Kablan et W. L. Ng 2.1 Le cadre ANFIS L'ANFIS est un réseau adaptatif de noeuds et de liens directionnels avec des règles d'apprentissage associées. L'approche apprend les règles et les fonctions d'appartenance à partir des données (Takagi et Sugeno, 1985). Il est appelé adaptatif parce que certains ou tous les noeuds ont des paramètres qui affectent la sortie du noeud. Ces réseaux identifient et apprennent les relations entre les intrants et les extrants, et ont des capacités d'apprentissage élevées et des propriétés de définition de fonction d'appartenance. Bien que les réseaux adaptatifs couvrent un certain nombre d'approches différentes, nous allons mener une étude détaillée de la méthode proposée par Jang et al. (1997) avec l'architecture montrée dans la figure 1. Figure 1 Architecture d'ANFIS pour un système de Sugeno de deux règle (voir la version en ligne pour des couleurs) Couche 1 Couche 2 Couche 3 Couche 4 Couche 5 XA 1 w 1 w 1 w 1 f 1 A 2 FYB 1 w 2 w 2 w 2 f 2 B 2 Les noeuds circulaires ont une relation entrée-sortie fixe, tandis que les noeuds carrés ont des paramètres à apprendre. Les règles floues typiques sont définies comme une instruction conditionnelle sous la forme: Si X est A1, alors Y est B 1. (1) Si X est A2, alors Y est B 2. (2) X et Y sont des variables linguistiques A i et B i sont des valeurs linguistiques déterminées par des ensembles flous sur les univers particuliers du discours X et Y respectivement. Cependant, dans ANFIS nous utilisons le système Takagi-Sugeno de premier ordre (Takagi et Sugeno, 1985), qui est: Si X est A et Y est B, alors f p X qy r. (3) Si X est A et Y est B, alors f p X q Y r. (4) X et Y représentent les univers du discours A i et B i sont des termes linguistiques définis par leurs fonctions d'appartenance, et p i, q i et r i sont les paramètres consécutifs qui sont mis à jour dans le passage direct dans l'algorithme d'apprentissage. Le passage vers l'avant propage le vecteur d'entrée à travers le réseau couche par couche. Dans le passe en arrière, l'erreur est retournée par le réseau d'une manière similaire à la propagation arrière. Nous analysons brièvement les cinq couches suivantes: 4 Le marché des changes à haute fréquence intraday avec les ANFIS 71 1 La sortie de chaque noeud de la couche 1 est: O mu (x) pour i 1,2 1, i O (x) pour i 3,4. 1, i Ai mub i 2 (5) Donc, O 1, i (x) est essentiellement la note d'appartenance pour x et y. Bien que les fonctions d'adhésion puissent être très flexibles, les résultats expérimentaux conduisent à la conclusion que pour la formation aux données financières, la fonction d'appartenance en cloche est la plus appropriée (voir, par exemple, Abonyi et al., 2001). Nous calculons 1 mu (x), A 2b i x ci 1 a i (6) où a i, b i et c i sont des paramètres à apprendre. Ce sont les paramètres des prémisses. 2 Dans la couche 2, chaque noeud est fixe. C'est là que la norme t est utilisée pour AND les qualités d'appartenance, par exemple, le produit: O2, i wi mu A (x) mub (y), i 1,2. (7) ii 3 La couche 3 contient des noeuds fixes qui calculent le rapport des résistances de tir des règles: O 3, w w w w ww Les noeuds de la couche 4 sont adaptatifs et exécutent le résultat des règles: () O wfwpxqyr (9 ) 4, iiiiii i. Les paramètres (p i, q i, r i) dans cette couche sont à déterminer et sont appelés les paramètres consécutifs. 5 Dans la couche 5, un seul nœud calcule la sortie globale: O wf (10) i i i 5, i wi fi. I i wi C'est ainsi que le vecteur d'entrée est généralement alimenté par le réseau couche par couche. Nous examinerons ensuite comment l'ANFIS apprend la prémisse et les paramètres conséquents pour les fonctions d'appartenance et les règles. Nous appliquons l'algorithme d'apprentissage hybride proposé par Jang et al. (1997) qui utilise une combinaison de la plus forte descente et de l'estimation des moindres carrés (LSE) pour calibrer les paramètres du réseau adaptatif (voir aussi Fontenla-Romero et al., 2003). Nous divisons l'ensemble de paramètres S en deux autres ensembles S 1, l'ensemble des paramètres prémisses (non linéaires), et S 2, l'ensemble des paramètres consécutifs (linéaires). Dans cette étude, ANFIS utilise un algorithme d'apprentissage à deux passages. Dans le passage vers l'avant, S 1 est non modifié et S 2 est calculé en utilisant un algorithme LSE, tandis que dans le passage en arrière, S 1 est non modifié et S 2 est mis à jour en utilisant un algorithme de descente en gradient tel que la rétropropagation (voir également l'illustration de la figure 2). (8) 5 72 A. Kablan et W. L. La tâche de l'algorithme d'apprentissage ANFIS pour cette architecture est de régler tous les paramètres modifiables, c'est-à-dire de faire correspondre la sortie ANFIS aux données de formation. Lorsque les paramètres de prémisses ai, bi et ci de la fonction d'appartenance sont fixés, la sortie du modèle ANFIS peut être écrite comme wwfffwfwfwwww (11) En particulier, le processus d'apprentissage consiste en un passage en avant et en rétropropagation, Avant, les signaux fonctionnels vont de l'avant jusqu'à la couche 4, et les paramètres consécutifs sont identifiés par l'estimation des moindres carrés. Dans la passe en arrière, les taux d'erreur se propagent vers l'arrière et les paramètres des prémisses sont mis à jour par la descente en gradient. Pour des valeurs fixes données de S 1, les paramètres dans S 2 trouvés par cette approche sont garantis pour être l'optimum global. Le tableau 1 présente un résumé des méthodes d'apprentissage. L'erreur de sortie est utilisée pour adapter les paramètres des prémisses à l'aide d'un algorithme standard de rétro-propagation. Tableau 1 Résumé des différentes méthodes d'apprentissage Passage vers l'avant Passage vers l'arrière Paramètres des prémisses Fixé Dégradé Paramètres consécutifs Signaux fixes LSE Node op Taux d'erreur Il existe quatre méthodes pour mettre à jour les paramètres: 1 Dégradé (GD) seulement: tous les paramètres sont mis à jour Par gradient de descente. 2 GD et un passage de LSE: LSE est appliqué une seule fois au départ afin d'obtenir les valeurs initiales des paramètres conséquents. GD puis mises à jour. 3 GD et LSE: la règle hybride proposée (voir aussi Jang, 1993). 4 Sequential LSE uniquement: utilise un filtre Kalman pour mettre à jour les paramètres. Dans ce chapitre, nous utilisons la troisième entrée de la liste ci-dessus pour l'utilisation d'ANFIS pour les prévisions financières, car cette méthode représente généralement un bon compromis entre la complexité computationnelle et la performance résultante (voir aussi Mitra et al., 2008). Le système proposé comme décrit ci-dessus prend maintenant la série de prix comme entrée, il prend d'abord une certaine quantité de m points de données pour la formation et de générer le système d'inférence floue initial à partir des données Valeurs, puis prend les m suivants points de données pour la validation. Cela générera un ANFIS qui a modifié ses paramètres et fonctions d'appartenance et est prêt à produire une prédiction pour les points de données suivants, compte tenu du modèle qu'il a reconnu. Le taux de réussite d'un tel système serait déterminé par son degré de précision dans la prédiction du mouvement des périodes de négociation suivantes en secondes, minutes, heures, jours, semaines ou mois, selon la fréquence de négociation. Prendre les bonnes décisions après le traitement de toutes les entrées des autres blocs est également essentiel à un système réussi (Sheen, 2005). En particulier, le système considère les trois dernières observations de prix sur le marché x (t 3), x (t 2), x (t 1) et l'observation courante x (t) pour prédire la prochaine observation de prix x (t 1) en utilisant ANFIS. Il est ensuite utilisé comme indicateur de mouvement (vers le haut ou vers le bas). En d'autres termes, pour faire une prédiction pour t 1, le système recevra le prix actuel à l'instant t plus les trois observations précédentes de prix t 1, t 2 et t 3, respectivement. Maintenant qu'un système pour prédire le mouvement du marché a été mis en œuvre, une position appropriée peut être ouverte selon l'indicateur de cette prédiction. Le pseudo-code est montré dans la Figure 3. Figure 3 Présentation de la position de maintien lorsque la prédiction ne change pas de direction BEGIN Former le système en utilisant les 500 derniers points vérifier la précision des systèmes en utilisant les 500 derniers points REPEAT à partir de maintenant jusqu'à 100 points générer la prédiction Si la prédiction suivante est à la hausse, alors maintenez-la enfoncée, puis maintenez-la enfoncée si la prédiction suivante est à la hausse. Et la fréquence de vente d'achat est réduite. Lorsque la ligne rouge descend (valeur fictive 0), le système est en mode de vente, restant inchangé signifie qu'il est en mode de maintien, et le déplacement en arrière (valeur factice 1) signifie qu'il est passé au mode d'achat. De plus, afin d'augmenter le rendement de l'investissement de négociation, une stratégie de prédiction et de négociation finale a été introduite lorsqu'une valeur de pointeur de déclenchement est utilisée. Par conséquent, pour une séquence de positions d'achat et de maintien, si la prédiction de l'échantillon suivant tombe au-dessous du déclencheur défini, la position est fermée, une position de vente est ouverte. La valeur du pointeur de déclenchement est mise à jour 7 74 A. Kablan and W. L. Ng après chaque itération, comme illustré dans le pseudo-code de la figure 5. Initialement, ce déclencheur est mis à la première valeur dans l'ensemble de données. Figure 5 Positionnement des positions en fonction de la prédiction du mouvement Figure 5 Présentation du déclencheur pour suivre la prédiction et détecter les changements directionnels pour ajuster le prix de déclenchement de la position (1) si la prédiction est en hausse et la prédiction gt déclencher puis déclencher (Now-1) position buy else si la prédiction est en baisse et la prédiction lt trigger then trigger prevision (now-1) position sell Après la mise en œuvre du système ANFIS ci-dessus, d'autres expériences ont dû être effectuées afin d'optimiser les résultats obtenus à partir de Le système ci-dessus. Un test important qui a été mené impliquait de faire varier le nombre d'époques et de tailles de pas dans chaque course sur le système. Dans la théorie des réseaux adaptatifs, une époque est définie comme une seule passe dans l'ensemble des données (chaque ensemble de données est évalué une fois). Cela signifie que plus nous avons d'époques, plus nous évaluons. Cependant, cela prend aussi plus de temps. Une époque est un balayage à travers tous les enregistrements de l'ensemble de données. Cela ne signifie pas que plus nous aurons d'époques, mieux ce sera les résultats. Nos expériences ont prouvé qu'un seuil existe à quel point un système atteindra la saturation et peu importe le nombre d'époques utilisées, la performance ne s'améliorera pas. En fait, un trop grand nombre d'époques entraînerait un surentraînement pour le système, entraînant une diminution de la performance (voir les figures 6a et 6b). La configuration initiale incluait un système de 80-époques qui a pris 18.4 secondes à exécuter pendant chaque exécution. On a utilisé des expériences pour différents nombres d'époques, ce qui a provoqué un changement dans le taux d'apprentissage qui peut être analysé dans les panneaux de la figure 6. La taille d'échelon est considérée comme une variable qui est corrigée après chaque quatrième époque, en comptant À partir de l'époque où la correction précédente a été effectuée. Il est réalisé sur la base des règles suivantes: 1 si l'erreur subit quatre réductions consécutives, puis augmentez la taille de pas par 10 2 si l'erreur passe successivement par une combinaison d'augmentations et de diminutions, puis diminuez la taille de pas par 10. Enfin Une autre variable est allouée pour stocker la dernière modification, qui stocke l'index de l'époque dans laquelle la taille de pas variable a été précédemment modifiée. En général, il n'existe pas de théorie concluante pour décider du nombre d'époques dans la littérature des réseaux neuronaux. Cependant, il est une règle générale pour éviter le problème de la surfaçon lors de l'augmentation du nombre d'époques. Pratiquement, on observe que plus le nombre d'époques d'apprentissage est élevé, meilleure est la performance de classification, mais cela aggrave la capacité de la généralisation par le réseau, donc la capacité de prédire correctement les futures données de traitement non vues auparavant. Ceci est confirmé par les résultats du tableau 2 dans la section empirique ci-dessous, de sorte que nous choisissons 80 comme taille d'époque optimale pour une brève discussion sur le choix des numéros d'époque, voir également Yezioro et al. (2008) et Chelani et Hasan (2001). (E, f) 50 époques (g, h) 10 époques (voir la version en ligne pour les couleurs) moyenne des racines au carré (c, d) 100 epochs (C) Erreur Erreur Vérification Erreur taille de pas échelle de pas taille de pas courbe nombre d'époques (b) courbe de la courbe de pas courbe nombre d'époques (d) 9 76 A Kablan et WL Ng Figure 6 erreur quadratique moyenne de l'erreur Courbes d'erreur et mise à jour de la taille des échelles pour différentes époques: (a, b) 180 époques (c, d) 100 époques (e, f) 50 époques (g, h) 10 époques (suite) Version en ligne pour les couleurs) Erreur Courbes Erreur d'entraînement Erreur de vérification Erreur numéro d'erreur numéro d'étape taille de pas courbe de la courbe nombre d'époques erreur quadratique moyenne (e) ) 2.3 Saisonnalité intraday Comme les activités de trading sont observées en temps réel, des approches communes pour mesurer la volatilité telles que l'écart-type ne peuvent être appliquées en raison de la structure de données inhomogène de la série chronologique. Par conséquent, un modèle d'observation saisonnière intraday (ISOM) comme un concept basé sur l'événement pour mesurer l'activité du marché sera utilisé dans cette étude comme un proxy pour la volatilité car il peut tracer les heures de la journée avec leur volatilité respective. Ceci est vu d'une perspective événementielle, où chaque changement directionnel avec un seuil spécifique est un événement. L'objectif est d'utiliser l'ISOM pour filtrer et nettoyer ces données en indiquant les périodes du jour où la volatilité a dépassé une certaine plage (nombre d'événements). L'idée ici est de prendre le nombre d'observations par intervalle d'échantillonnage intraday afin de produire un modèle qui permettrait d'estimer le nombre d'observations moyennes qui se produisent pour la fenêtre de temps de jour cible (voir aussi Bauwens et al., 2005). Dans le commerce financier, on entend par événements de changement de direction (cc) les mouvements de prix, où un mouvement de prix total entre deux niveaux de prix extrêmes, exprimé en saut de prix relatif de la taille de seuil dx (), peut être décomposé en réversion de prix Dire le changement de direction lui-même) et des sections de dépassement (Glattfelder et al., 2010). L'ISOM pour un moment particulier de la journée t à un seuil particulier dx est égal au nombre total d'événements de changement de direction qui se sont produits à cette fenêtre de temps t bin dans l'ensemble de données: 10 Intraday high-frequency FX trading avec ANFIS 77 n ISOM T dx) N (dc t tbin) jour, (12) jour 1 où n est le nombre total de jours dans l'ensemble de données, et N (dc) le nombre de changements directionnels (événements). Dans sa définition simple, l'ISOM est un modèle qui prend en compte un certain seuil dx () et observera les instants où les changements directionnels dc se produisent. Il analyserait itérativement et consécutivement tout le jeu de données des prix et sauvegarderait les observations dans leurs compartiments de temps respectifs. Cela donnerait finalement un horizon de saisonnalité, en indiquant les heures exactes du jour où ces observations ont été faites. Cela indique les heures du jour où la volatilité était élevée ou faible. L'idée est que les données seront visualisées d'un point de vue de la loi d'échelle des changements directionnels (événements), où chaque variation de pourcentage en amont dans un seuil prédéterminé est observée, les horodateurs et le prix relatif sont marqués et toutes les données sont stockées itérativement Dans des casiers de valeur temporelle, qui seront ensuite analysés plus loin. À titre d'illustration, lorsqu'on l'applique avec un changement de dx 0,05 pendant 30 minutes, les fenêtres de la paire de devises étrangères EUR-USD ont été observées de 04042006 à 04042008. L'ISOM a donné le schéma de saisonnalité représenté à la figure 7. Le graphique révèle que la plupart des Les événements de changement de direction se produisent entre 12:00 et 14:00 GMT. Cela confirme le fait que ce sont les moments où les annonces sont faites et la réaction du marché à ces annonces a lieu. C'est aussi le moment où les marchés américains s'ouvrent par conséquent, la volatilité des marchés augmente. D'autres périodes de forte volatilité se produisent entre 7:00 et 8:00 GMT, qui est habituellement le temps avant les marchés européens ouverts. Figure 7 ISOM pour un seuil de dx 0,5 mouvement de prix observé toutes les 30 minutes pour la paire FX EURUSD de 04042006 à 04042008 (voir version en ligne pour les couleurs) L'ISOM montre que lorsque l'on considère les observations toutes les 30 minutes, la période avec la volatilité la plus élevée est entre 12:30 et 13:00 GMT, qui est à nouveau le moment où toutes les annonces qui ont été faites à 12:00 ont été absorbés par les marchés et les commerçants ont commencé à agir sur eux. La période de négociation la plus élevée se produit entre 12h00 et 16h00 GMT, c'est-à-dire les périodes qui incluent les annonces, l'ouverture des marchés américains jusqu'à la fermeture des marchés européens. Les résultats ci-dessus ont confirmé des événements réels qui sont connus pour augmenter la volatilité des marchés. Ils peuvent, Ng a également aider le commerçant ou le système à ignorer les périodes qui connaissent un faible nombre d'événements. Il faut noter que l'ISOM peut être appliqué à n'importe quel seuil et n'importe quelle fréquence de temps (quotidiennement, demi quotidien, quart quotidien, cinq minutes, etc.). Nous avons pris un seuil de dx 0,05 pour la portée de cette illustration, le concept peut être appliqué librement à n'importe quel seuil ou fréquence temporelle (des chiffres supplémentaires illustrant la saisonnalité intraday pour les autres valeurs de seuil sont montrés à la figure 10 de l'annexe). L'étape suivante consiste maintenant à utiliser ISOM pour filtrer et nettoyer ces données en indiquant les périodes du jour où la volatilité a dépassé une certaine plage (nombre d'événements). Le modèle ISOM a été redessiné pour fournir des données de cinq minutes plutôt que des données horaires ou 30 minutes, comme indiqué précédemment. Nous avons maintenant des casiers de données de cinq minutes, et nous capturons les changements directionnels tels qu'ils se produisent dans ces casiers, où le compteur d'événements augmentera en fonction du nombre d'événements et du nombre de fois où le seuil a été dépassé. Dans cette étude, ANFIS a été alimenté données de l'époque du jour où le nombre d'observations a dépassé dix événements. Après avoir été formé sur les données avec une plus grande volatilité (entraînement au stress), ANFIS effectuera la prédiction d'un ensemble de données de contrôle. Le pseudo-code est représenté sur la figure 8. Figure 8 Optimisation de l'ANFIS avec la fonction ISOM Collect-ISOM-Times BEGIN pour i 2 à la fin (données dans l'échantillon) calculer le pourcentage des changements directionnels dc (i) Prix ​​(i-1) 100) prix (i-1) en abs (dc (i)) gt 0,05 temps d'observation de sauvegarde (T) nombre d'observations pour le temps respectif (Tcount) ObservationsPerDay Tcountlength (in-sample-data ) Si ObservationsPerDay gt 5 ValidISOMTimeBin T fin si fin si fin pour END Fonction Utilisation-ISOM-pour-Formation-ANFIS BEGIN pour k 1 à fin (données hors échantillon) si temps ValidISOMTimeBin train ANFIS effectuer des prédictions sinon passer à la prochaine fois Bin end if end pour END 12 Intraday high-frequency FX trading avec ANFIS 79 3 Données empiriques et résultats Le marché FX est un marché mondial ouvert 24 heures sur 24 avec des liquidités et une volatilité élevées, notamment dans les trois principaux centres financiers à influence internationale: New York , Londres et Tokyo. La volatilité est la plus élevée au début de la nuit à New York, car les échanges à Londres et à New York sont ouverts et se négocient simultanément. Des faits stylisés tels que l'asymétrie gain-perte et les queues lourdes sont observés dans les distributions de retour FX (Bauwens et al., 2005). Les banques commerciales, les sociétés, les institutions de financement et de détail de partout dans le monde participent aux opérations de change. Le prix sur le marché FX est formé par l'achat et la vente de devises aux institutions, les commerçants, les exportateurs, les importateurs, les gestionnaires de portefeuille et les touristes. De nos jours, les commandes sont électroniquement assorties via des terminaux de courtage automatisés. Yoon et al. (1994) indiquent qu'environ 85 de tous les échanges de devises se produisent entre les créateurs de marché. Cela crée une occasion de spéculation. Dans cette étude, les données FX haute fréquence échantillonnées de 04042006 à 04042008 ont été introduites dans le système commercial. Pour l'analyse, nous calculons le prix moyen à partir des données de cotation (Dacorogna et al., 2001). Dans la mesure où nous négocions sur des effets de change, le demi-spread, qui est le seul coût de transaction que les commerçants doivent considérer dans ce type de marché, est déjà implicitement pris en compte dans toutes les stratégies rapportées. Le système a été testé sur cinq taux de change, qui sont: EUR-USD, AUD-USD, GBP-USD, USD-CHF et USD-JPY. La figure 9 montre les différentes séries temporelles qui ont été utilisées dans cette étude. Figure 9 Série chronologique des cinq paires de devises FX observées de 04042006 à 04042008, normalisées à 1USD (voir version en ligne pour les couleurs) Ce jeu de données original de données de prix de cinq minutes est divisé en sous-ensembles de données (sans chevauchement) Points, pour chacun des taux de change. Un m trop petit (disons 100 points) peut ne pas suffire à construire une dynamique et à obtenir un nombre d'observations (événements) désiré car le seuil ne peut pas être dépassé. De même, un plus grand nombre pourrait inclure plus d'observations que nous souhaitons pour une série du système qui entraînerait le surentraînement et la suralimentation (Yeh et al., 2011). Comme toutes les fréquences à haute fréquence ont un taux de 13 80 A. Kablan et W. L. Ng quantité différente de points de données, m a été choisie de sorte que la série de toutes les ont raisonnablement comparables sous-ensembles de données. Pour chaque série de taux de change, les premiers 500 points de données dans l'échantillon de chaque sous-ensemble sont utilisés pour la formation du système. Les 500 points de données suivants sont considérés comme étant hors échantillon et utilisés pour valider les performances du système et mettre à jour la structure du réseau en utilisant l'erreur de sortie. Les 500 points de données qui ont été utilisés pour la validation lors d'une simulation peuvent être réutilisés pour recycler le système lors de la simulation suivante, créant ainsi une approche de la fenêtre continue pour la formation et la validation du système, en exploitant pleinement toutes les données disponibles. Afin d'évaluer la performance du modèle proposé, nous comparerons l'ANFIS avec les stratégies standard qui sont couramment appliquées dans l'industrie, telles que l'achat et la conservation, par ex. Yeh et al. (2011), p.796, Section 2.2 ou une prévision linéaire en utilisant des signaux de retour de tendance ou de tendance, par ex. Schulmeister (2009), pp. Section 2. Nous utilisons différentes mesures pour l'évaluation, comme un b c d e le taux de bénédiction le facteur de profit le retour de l'investissement (ROI) le ratio de Sharpe le ratio Sortino. Le taux gagnant décrit simplement le nombre de métiers gagnants par rapport au nombre total de métiers. Le facteur de profit décrit principalement la rentabilité historique d'une série de transactions sur un investissement. Le seuil de rentabilité du facteur de profit est 1, ce qui signifie un investissement qui génère des métiers avec une chance de 50 de la somme brute des métiers gagnants et une chance de 50 de la somme brute de la perte de métiers. Normalement, les investisseurs choisissent des placements avec un facteur de profit supérieur à un. Le ROI sert à évaluer l'efficacité d'un investissement ou à comparer les rendements des investissements. C'est-à-dire, ROI est le rapport du profit gagné ou perdu sur un investissement par rapport au montant du coût investi. Le ratio de Sharpe est utilisé pour mesurer le rendement ajusté en fonction du risque d'un actif de placement ou d'un portefeuille, ce qui peut indiquer aux investisseurs dans quelle mesure le rendement d'un actif compense les investisseurs pour le risque pris. Le ratio de Sharpe est défini comme Rp R Sharpe ratio sigma p f, où R p désigne le rendement attendu, R f le taux d'intérêt sans risque et sigma p la volatilité du portefeuille. Techniquement, ce ratio mesure la prime de risque par unité de risque total dans un actif de placement ou un portefeuille. Les investisseurs choisissent souvent des placements avec des ratios de Sharpe élevés parce que plus le ratio Sharpe est élevé, meilleure est la performance ajustée en fonction du risque. Comme il n'existe pas de taux d'intérêt sans risque pour les échéances intraday, nous utilisons le rendement moyen du sous-ensemble de données de formation comme un substitut. Similarly, the Sortino ratio is defined as Rp Rf Sortino ratio , sigma neg 14 Intraday high-frequency FX trading with ANFISs 81 where sigma neg denotes the standard deviation of only negative asset returns. The main difference between the Sharpe ratio and the Sortino ratio is that the Sortino ratio only penalises the downside volatility, while the Sharpe ratio penalises both upside and downside volatility. Thus, the Sortino ratio measures the risk premium per each unit of downside risk in an investment asset or a portfolio. When training the ANFIS, it has been noticed after running initial experiments that the larger the numbers of epochs, the more stable the system will be because of damping oscillation (see Figure 6). Furthermore, the larger the size of the step, the faster the errors will decrease, although there will be more oscillations. When designing a system that will trade in high frequency, a major category that has to be satisfied along with high performance and optimum results is high speed or run-time and execution. As it can be seen from the Figure 6 and Table 2, a low (high) number of epochs results in a system that is rather fast (slow). On the other hand, a low number of epochs produces very poor results compared to a higher number of epochs, which produces a system with very high performance rates. However, it was also observed from the experiments that as the number of epochs increases, there may be a stage where the performance does not increase as much as required, whereas the time of execution increases drastically. Hence, it is a matter of compromise between speed and performance. This issue can be resolved by choosing a system with 80 epochs, where it has been found to produce the highest performance for the smallest amount of time after conducting extensive experiments (see Table 2). Furthermore, since the system trades on five-minute intervals, a time of seconds cannot be considered a long execution time, given the complexity of the ANFIS design. Having determined the number of epochs to be considered, ANFIS was fed data from the times of day when the number of observations exceeded ten events. After being trained on data with higher volatility (stress training), ANFIS will perform prediction of a set of checking data. Table 2 Num. of epochs Out-of-sample evaluation of the ANFIS system using various numbers of epochs CPU time (secs) Winning rate Profit factor ROI Sharpe ratio Sortino ratio As mentioned before, all sub-datasets used for validation of the implemented trading system is considered as the out-of-sample. The performance measures introduced above are computed for each validation sub-dataset. Table 3 reports the overall average performance measure for 1 the buy and hold 2 the momentum (trend following) 3 the contrarian (trend reversal) 4 the Intraday ANFIS trading strategy. 15 82 A. Kablan and W. L. Ng Table 3 Comparison of the average performance measures in the out-of-sample for all implemented trading strategies FX pair Winning rate Profit factor ROI Sharpe ratio Sortino ratio EUR-USD Buy and hold Momentum Contrarian Intraday ANFIS AUD-USD Buy and hold Momentum Contrarian Intraday ANFIS GBP-USD Buy and hold Momentum Contrarian Intraday ANFIS USD-CHF Buy and hold Momentum Contrarian Intraday ANFIS USD-JPY Buy and hold Momentum Contrarian Intraday ANFIS With respect to the winning rate, Table 3 shows that in most cases, the ANFIS system outperforms the standard strategies in the overall number of wins. In terms of the profit factor, which indicates the actual profitability of a series of trades on an investment, the results show that the ANFIS system also has a profit factor higher than 1 in most cases. Table 3 also reveals that ANFIS generally obtains a higher ROI than the conventional strategies, i. e. it has a higher ratio of profit gained on a trade in relation to the amount of cost invested. Last not least, the Sharpe ratio and Sortino ratio, which measure the investment per unit of risk, also indicate a better performance of the ANFIS model, but less consistent as compared to the other benchmark values. Positive Sharpe and Sortino ratios imply that the trading strategy has not taken high risk. Other descriptive statistics of performance measures in the out-of-sample such as the standard deviation, skewness and kurtosis are listed in Table 4 in the Appendix. It can be seen that in general the performance measures for ANFIS have a lower standard deviation (higher accuracy), higher skewness (higher outperformance) as compared to the 16 Intraday high-frequency FX trading with ANFISs 83 benchmark models. Comparisons for the kurtosis are rather inconsistent, allowing no particular conclusion. Finally, in order to statistically test the performance of a benchmark model (either buy and hold, momentum or contrarian) compared to the proposed ANFIS model, Table 5 in the Appendix lists the test-statistics of the (one tailed) t-test with the null-hypothesis that average measure for the benchmark is better than that for the ANFIS. A negative test-statistic with a value lower than indicates a rejection of the null-hypothesis at a 5 significance level, implying a statistically significant outperformance of the ANFIS strategy. Furthermore, a low positive value of the test-statistic would imply that a particular benchmark model is not significantly better than ANFIS (e. g. Sortino ratios for AUS-USD or USD-JPY). 4 Conclusions The distinctive area of soft computing and artificial intelligence was addressed in this project by revisiting and improving the performance of the ANFIS by manipulating the number of epochs and the learning rate. It was concluded that a certain number of optimal epochs should not be exceeded, since this would not drastically improve the system. The ISOM proposed in this project has been tested on various threshold levels. The observation of a directional change within a threshold leads to taking the time stamp and its consequential addition to all of the observations that have been made during that time. The power of this method lies in the fact that any threshold can be used for any time frequency. This leads to the observation of events for the entire data series from a new perspective. The above concepts of event-driven volatility have proven to be consistent with ANFIS if sufficient data is present to perform the ISOM. A comparison of the proposed model against the standard trading strategies that are commonly applied in the industry shows an outperformance of the Intraday ANFIS. Acknowledgements The authors would like to thank Steve Phelps, Nikos S. Thomaidis (editor) and three anonymous referees for their valuable comments and suggestions that led to an improvement of this paper. References Abonyi, J. Babuscaronka, R. and Szeifert, F. (2001) Fuzzy modeling with multivariate membership functions: gray box identification and control design, IEEE Transactions on Systems, Man, and Cybernetics Part B, Vol. 31, No. 5, pp Aldridge, I. (2009) High-frequency Trading A Practical Guide to Algorithmic Trading Strategies and Trading Systems, Wiley, NJ. Bauwens, L. Omrane, B. and Giot, P. (2005) News announcements, market activity and volatility in the euro-dollar foreign exchange market, Journal of International Money and Finance, Vol. 24, No. 7, pp 17 84 A. Kablan and W. L. Ng Castillo, E. Guijarro-Berdinas, B. Fontenla-Romero, O. and Alonso-Betanzos, A. (2006) A very fast learning method for neural networks based on sensitivity analysis, Journal of Machine Learning Research, Vol. 7, pp Chelani, A. and Hasan, M. (2001) Forecasting nitrogene dioxide concentration in ambient air using artificial neural-networks, International Journal of Environmental Studies, Vol. 58, No. 4, pp Dacarogna, M. Genccedilay, R. Muumlller, U. A. Pictet, O. and Olsen, R. (2001) An Introduction to High-Frequency Finance, Academic Press, San Diego. Dempster, M. A.H. and Jones, C. M. (2001) A real-time adaptive trading system using genetic programming, Quantitative Finance, Vol. 1, No. 4, pp Denaiuml, M. Palis, F. and Zeghbib, A. (2007) Modeling and control of non-linear systems using soft computing techniques, Applied Soft Computing, Vol. 7, No. 3, pp Fontenla-Romero, O. Erdogomus, D. Principe, J. C. Alonso-Betanzos, A. and Castillo, E. (2003) Linear least-squares based methods for neural networks learning, Lecture Notes in Computer Science, Vol. 27142003, No. 173, pp Glattfelder, J. B. Dupuis, A. and Olsen, R. (2010) Patterns in high-frequency FX data: discovery of 12 empirical scaling laws, Working paper, arxiv: v2. Hellstrom, T. and Holmstroumlm, K. (1998) Predicting the stock market, Technical Report Ima-TOM. Center of Mathematical Modeling, Department of Mathematics and Physics, Maumllardalen University, Sweden. Jang, J. R. (1993) ANFIS: adaptive network-based fuzzy inference system, IEEE Transactions on Systems, Man and Cybernetics, Vol. 23, No. 3, pp Jang, J. R. Sun, C. T. and Mizutani, E. (1997) Neuro-Fuzzy and Soft Computing, Prentice Hall, Upper Saddle River, NJ. Kasabov, N. K. and Song, Q. (2002) DENFIS: dynamic evolving neural-fuzzy inference system and its application for time-series prediction, IEEE Transactions on Fuzzy Systems, Vol. 10, No. 2, pp Konstantaras, A. Varley, M. R. Vallianatos, F. Collins, G. and Holifield, P. (2006) Neuro-fuzzy prediction-based adaptive filtering applied to severely distorted magnetic field recordings, IEEE Geoscience and Remote Sensing Letters, Vol. 3, No. 4, pp Mitra, P. Maulik, S. Chowdhury, S. P. and Chowdhury, S. (2008) ANFIS based automatic voltage regulator with hybrid learning algorithm, International Journal of Innovations in Energy Systems and Power, Vol. 3, No. 2, pp.1 5. Murphy, J. (1986) Technical Analysis of Futures Markets, New York Institute of Finance, New York. Schulmeister, S. (2009) Profitability of technical stock trading: has it moved from daily to intraday data. Review of Financial Economics, Vol. 18, No. 4, pp Sewell, M. V. (2010) The application of intelligent systems to financial time series analysis, PhD dissertation, Department of Computer Science, University College London, University of London. Sheen, J. N. (2005) Fuzzy financial decision-making: load management programs case study, IEEE Transactions on Power Systems, Vol. 20, No. 4, pp Takagi, T. and Sugeno, M. (1985) Fuzzy identification of systems and its application to modeling and control, IEEE Transactions on Systems, Man and Cybernetics, Vol. 15, No. 1, pp Yeh, I-C. Lien, C. and Tsai, Y-C. (2011) Evaluation approach to stock trading system using evolutionary computation, Expert Systems with Applications, Vol. 38, No. 1, pp Yezioro, A. Dong, B. and Leite, F. (2008) An applied artificial intelligence approach towards assessing building performance simulation tools, Energy and Buildings, Vol. 40, No. 4, pp 18 Intraday high-frequency FX trading with ANFISs 85 Yoon, Y. Guimaraes, T. and Swales, G. (1994) Integrating artificial neural networks with rule-based expert systems, Decision Support Systems, Vol. 11, No. 5, pp Notes 1 Simulations have been performed on a Toshiba Tecra A9-11M Laptop PC. CPU type: Intel Core 2 Duo, CPU speed: 2.4 GHz, internal memory: 2048 MB, hard drive size: GB. Appendix Figure 10 ISOM for alternative thresholds: (a) threshold 0.2 (b) threshold 0.4 (c) threshold 0.6 (see online version for colours) (a) (b) (c) 19 86 A. Kablan and W. L. Ng Table 4 Descriptive statistics for the performance measures in the out-of-sample for all implemented trading strategies 20 Intraday high-frequency FX trading with ANFISs 87 Table 5 t-tests on significance of the outperformance of the Intraday ANFIS compared to the benchmark models Winning rate Profit factor ROI Sharpe ratio Sortino ratio EUR-USD Buy and hold Momentum Contrarian AUD-USD Buy and hold Momentum Contrarian GBP-USD Buy and hold Momentum Contrarian USD-CHF Buy and hold Momentum Contrarian Intraday ANFIS USD-JPY Buy and hold Momentum Contrarian Notes: This table lists the test-statistics of the (one-tailed) t-test with the null-hypothesis that the average performance of a benchmark model (either buy and hold, momentum or contrarian) is better than that of the ANFIS model, i. e. H 0. micro BENCHMARK micro ANFIS. A negative value lower than indicates a rejection of the null at a 5 significance level.


No comments:

Post a Comment