R cran forex

Dados Financeiros Acessíveis a partir de R - parte III.
Eu encontrei uma nova fonte de dados que eu acho que realmente vale a pena compartilhar: ThinkNum. Ele reúne cerca de 2.000 fontes de dados, mas, o mais importante, permite ao usuário manipular esses dados por meio de funções e gráficos e existe um pacote R disponível no CRAN. Os leitores interessados podem encontrar um post muito bom explorando algumas das funcionalidades aqui.
Yahoo: cotações de ações gratuitas, notícias atualizadas, recursos de gerenciamento de portfólio, dados do mercado internacional, fóruns e taxas de hipoteca que o ajudam a gerenciar sua vida financeira FRED: Baixe, grafica e rastreie 149 mil séries temporais econômicas de 59 fontes Oanda: Moeda informações, ferramentas e recursos para investidores, empresas e viajantes Google: cotações do mercado de ações, notícias, conversões de moeda e amp; mais Quandl: preços de futuros, diariamente. Quandl é um mecanismo de busca de dados numéricos. O site oferece acesso a vários milhões de conjuntos de dados financeiros, econômicos e sociais TrueFX: Tick-By-Tick Taxas de mercado em tempo real e históricas, Limpo, Agregado, Preços do revendedor Bloomberg: notícias financeiras, notícias de negócios, notícias econômicas, cotações de ações, citações de mercado , finanças, mercados financeiros, futuros de ações, finanças pessoais, conselhos de finanças pessoais, fundos mútuos, calculadoras financeiras, negócios mundiais, pequenas empresas, tendências financeiras, negociação forex, notícias tecnológicas, notícias financeiras bloomberg Interactive Broker: Interactive Brokers Group, Inc. é uma empresa de corretagem de desconto on-line no Datastream dos Estados Unidos: o Datastream Professional é uma ferramenta poderosa que integra pesquisa econômica e estratégia com análise de ativos cruzados para reunir de forma simples de cima para baixo e de baixo para cima em um único aplicativo integrado: The Penn World Table fornece paridade de poder de compra e contas de renda nacional convertidas em preços internacionais para 189 países / territórios para alguns ou todos dos anos 1950-2018 Thinknum: Thinknum traz dados financeiros de uma variedade de fontes úteis em uma plataforma. Usamos esses dados para desenvolver aplicativos.
Quantlod: Especificar, construir, negociar e analisar estratégias quantitativas de negociação financeira. Quandl: este pacote interage diretamente com a API de Quandl para oferecer dados em vários formatos utilizáveis em R, bem como a capacidade de carregar e pesquisar TFX: Conecta R para TrueFX (tm) para transmissão de dados de mercado em tempo real e históricos históricos para taxas de câmbio interbancárias negociáveis com detalhes de milissegundos Rbbg: lida com dados da aplicação de dados financeiros da Bloomberg IBrokers: fornece acesso nativo R a corretores interativos Trader Workstation API rdatastream: RDatastream é uma interface R para a Thomson Dataworks Entreprise SOAP API (sem livre), com algumas funções de conveniência para recuperar dados Datastream especificamente. Este pacote requer credenciais válidas para este API pwt: a tabela Penn World fornece contas de paridade de poder de compra e contas de renda nacional convertidas em preços internacionais para 189 países / territórios durante alguns ou todos os anos 1950-2018 fImport: Rmetrics é o principal software de código aberto solução para o ensino e treinamento de finanças quantitativas. O iMport é o pacote de Importação de Dados Econômicos e Financeiros Thinknum: este pacote interage diretamente com a Thinknum API para oferecer dados em vários formatos utilizáveis em R.

O R Trader.
Usando R e ferramentas relacionadas em Finanças Quantitativas.
Mantendo um banco de dados de arquivos de preços em R.
Fazer pesquisas quantitativas implica uma grande quantidade de dados crunching e um precisa de dados limpos e confiáveis para conseguir isso. O que é realmente necessário é a limpeza de dados facilmente acessíveis (mesmo sem conexão à internet). A maneira mais eficiente de fazer isso por mim tem sido manter um conjunto de arquivos csv. Obviamente, esse processo pode ser tratado de várias maneiras, mas eu encontrei horas extras muito eficientes e simples para manter um diretório onde eu armazeno e atualize arquivos csv. Eu tenho um arquivo csv por instrumento e cada arquivo é nomeado após o instrumento que ele contém. A razão pela qual eu faço isso é dupla: primeiro, eu não quero baixar dados (preço) do Yahoo, Google etc e # 8230; Toda vez que eu quero testar uma nova ideia, mas mais importante, uma vez que eu identifiquei e corrigi um problema, não quero ter que fazer isso novamente na próxima vez que eu precisar do mesmo instrumento. Simples, mas muito eficiente até agora. O processo está resumido no quadro abaixo.
Em tudo o que se segue, suponho que os dados sejam provenientes do Yahoo. O código terá que ser alterado para dados do Google, Quandl etc e # 8230; Além disso, apresento o processo de atualização dos dados diários de preços. A configuração será diferente para dados de freqüência mais alta e outro tipo de conjunto de dados (ou seja, diferente dos preços).
1 & # 8211; Transferência inicial de dados (listOfInstruments. R & amp; historicalData. R)
O arquivo fileOfInstruments. R é um arquivo contendo apenas a lista de todos os instrumentos.
Se um instrumento não é parte da minha lista (ou seja, nenhum arquivo csv na minha pasta de dados) ou se você fizer isso pela primeira vez que você precisa baixar o conjunto de dados históricos inicial. O exemplo abaixo baixa um conjunto de preços diários dos ETFs do Yahoo Finance de volta para janeiro de 2000 e armazena os dados em um arquivo csv.
2 & # 8211; Atualizar dados existentes (updateData. R)
O código abaixo começa a partir de arquivos existentes na pasta dedicada e atualiza todos eles um após o outro. Costumo executar esse processo todos os dias, exceto quando eu estiver no feriado. Para adicionar um novo instrumento, basta executar o passo 1 acima para este instrumento sozinho.
3 & # 8211; Crie um arquivo em lote (updateDailyPrices. bat)
Outra parte importante do trabalho é criar um arquivo em lote que automatiza o processo de atualização acima (I & # 8217; m um usuário do Windows). Isso evita abrir o R / RStudio e executar o código a partir daí. O código abaixo é colocado em um arquivo. bat (o caminho deve ser alterado com a configuração do leitor). Observe que eu adicionei um arquivo de saída (updateLog. txt) para rastrear a execução.
O processo acima é extremamente simples porque ele apenas descreve como atualizar os dados de preços diários. Eu já usei isso por um tempo e tem funcionado muito bem para mim até agora. Para dados mais avançados e / ou frequências mais elevadas, as coisas podem ficar muito mais complicadas.
Como de costume, todos os comentários são bem-vindos.
28 Comentários.
Viver perigosamente, então?
Se, por algum motivo, o seu passo dt = rbind (dados, recente) falhar (vários motivos, isso pode acontecer, por exemplo, getSymbols () falha), então dt = NULL substituirá todo o arquivo de dados.
I & # 8217; d recomenda, pelo menos, adicionar uma etapa de arquivamento antes de carregar os dados.
Se você tiver o tempo / inclinação, um banco de dados real (por exemplo, MySQL / SQLite / Access) pode ser benéfico e fácil de integrar em um fluxo de trabalho R. Executar esse tipo de coisa como um trabalho cron diário no Linux torna o tempo mais consistente também. Por último, o encadeamento de dplyr tornaria muito desse código mais simples (sinta-se livre para entrar em contato para discutir).
Você está certo sobre o dt = NULL. Nunca aconteceu comigo, mas isso é um risco risco. Eu provavelmente deveria ter mencionado que eu execute um processo separado que duplica todos os arquivos de dados diariamente e sim poderia ser adicionado ao código que postei.
No que diz respeito ao MySQL / SQLite / Access, acho que é um excesso de informação tão simples (estrutura muito simples de baixo volume). Eu usei SQL como db extensivamente no passado e há um benefício real de usar essas ferramentas somente quando os dados são complexos ou o pré-processamento é necessário / útil, este não é o caso aqui.
Eu ficarei feliz em dar uma olhada em uma implementação de dplyr se você quiser compartilhar isso? Nunca aproveitei o tempo para dar uma olhada neste pacote.
Muito obrigado, isso é super útil.
Duas coisas que você pode considerar:
1. O paste0 é útil, evita sep = & # 8221; & # 8221;
2. Para evitar clicar no arquivo em lotes todos os dias, por que não configurar uma tarefa automatizada no agendador de tarefas do Windows? Nesse caso, você deve redirecionar a saída através do coletor: statmethods / interface / io. html.
Obrigado pela dica. Eu não sabia sobre o paste0.
Sim, o programador é uma possibilidade. É só que a execução do arquivo. bat faz parte da minha rotina diária.
Como você lida com dividendos? Eu tentei algo semelhante, mas tive problemas quando uma ação emitiu um dividendo.
Por exemplo, nos últimos 5 dias, o preço ajustado é o mesmo que o preço de fechamento. Mas se hoje um dividendo é distribuído, o Yahoo ajusta os últimos 5 dias de preços. Então, o que eu estava coletando agora será diferente do que se eu baixasse toda a série hoje. Pergunto-me se você lida com isso.
Na verdade, baixei os preços de fechamento e os preços ajustados. Eu posso usar qualquer uma dessas séries de acordo com o que eu estou fazendo.
[& # 8230;] Mantendo um banco de dados de arquivos de preços em R [R Trader] Fazer pesquisas quantitativas implica uma grande quantidade de dados e um precisa de dados limpos e confiáveis para conseguir isso. O que é realmente necessário é a limpeza de dados facilmente acessíveis (mesmo sem conexão à internet). A maneira mais eficiente de fazer isso por mim tem sido manter um conjunto de arquivos csv. Obviamente, esse processo pode ser tratado de várias maneiras, mas eu encontrei horas extras muito eficientes e simples para [& # 8230;]
Parece que no script do Update Data File, seu StartDate é escrito em StatDate.
Obrigado por detectar isso. Eu mudei isso.
Obrigado pelo seu código de exemplo!
Eu consegui trabalhar no Linux com algumas pequenas modificações. Eu aconselho você a usar file. path para montar nomes de arquivos como em:
Isso torna seu código mais compatível.
Eu tenho que usar o argumento sep em read. csv para ler corretamente o arquivo de saída do zoológico como em:
data = read. csv (file. path (thePath, ii), sep = & # 8221; & # 8220;)
Obrigado pela dica.
Obrigado pela publicação informativa. Eu estava trabalhando nisso como um projeto paralelo e sua visão geral foi muito útil. Uma coisa que eu tentei resolver foi obter um & # 8220; válido & # 8221; lista de símbolos de estoque. Puxando-os com a função, StockSymbols, obtém uma lista longa, mas muitos deles retornam erros usando getSymbols. Não estou muito preocupado com os erros neste momento, mas quero tornar a criação da lista mais automatizada. Por exemplo, escrevi o script para gerar a lista de símbolos de ticker e, em seguida, remova todos os símbolos com divisão (por exemplo, ações preferenciais, etc.), mas alguns desses símbolos de cinco caracteres continuam a gerar erros quando eu executar o script para tornar o csv arquivos que irão armazenar os dados do preço. Seria muito útil ter o loop que puxa a verificação de dados para ver se a consulta para yahoo retorna dados válidos e, se não, salve o símbolo em outro lugar (por exemplo, badTickers. csv). Existe alguma maneira de fazer isso facilmente? Ainda estou aprendendo R, mas não encontrei muito para # 8216; manipulação de erros & # 8217; como isso. Obrigado novamente!
Boa solução compacta!
Os preços ajustados provavelmente precisam de uma refinação: se uma ação for ex-dividendo em geral, todos os preços ajustados passados mudam. Isso pode criar lacunas na sua série ajustada, se apenas os últimos dias forem concatenados no final e nenhum outro ajuste de cálculos for feito.
Seu bom Script, mas updateData. R precisa de alguma correção, parece que precisamos ter mais um par de suprimentos de flores ao final.
Obrigado por detectar isso. Vou corrigir o código.
Este foi um pedaço de código útil. Também em updateData. R, Line no. 7 (lookback = 60) & amp; 8 (startDate = Sys. Date () & # 8211; lookback) não são necessários se você mudar o número da linha. 20 para (de = lastHistoricalDate,)
Apenas para tornar o código sucinto.
por exemplo. Ótimo trabalho. Vou dar meus primeiros passos em R. Perguntei se você considerou o download de arquivos de fim de dia (um arquivo csv com todas as cotações em um mercado) para manter seu banco de dados atualizado? Se você tem que manter atualizado todas as cotações na NYSE, AMEX e amp; NASDAQ isso funciona muito rápido. Isso pode ser feito através do wsj / mdc / public / page / 2_3024-NYSE. html e depois do & # 8220; salvar no botão da planilha & # 8221; o que você pode fazer automaticamente com algumas linhas de código. Claro, você ainda precisa construir seu banco de dados histórico. Então você tem um banco de dados completo à sua disposição.
Eu nunca usei isso, mas eu vou dar uma olhada nisso. Parece uma boa dica!
Boa ideia. Eu sempre esqueço quanto tempo demora para remover resultados obviamente anômalos e lidar com dados perdidos. Desta forma, você apenas faz isso uma vez. Eu tenho uma longa lista de tickers em que eu estou interessado e muitos deles são ETFs onde o ticker não tem link óbvio com o nome! Eu adicionei o seguinte código à parte inferior do script listOfInstruments que me dá um bom quadro de dados com o nome, bem como o ticker. Infelizmente, o nome é truncado (31 caracteres), o que é um problema com muitos ETFs, mas geralmente é o suficiente para me lembrar o que é.
I & lt; - paste (theInstruments, collapse = & quot; + & quot;)
stock_info & lt; - read. csv (url, header = F)
THX. Isso também pode ser útil para mim!
Obrigado por este & # 8211; ótimo ponto de partida para mim. Você é capaz de compartilhar seu código para saber como você lê todos esses CSVs e carregá-los no ambiente R? Eu gostaria de fazer isso e depois calcular correlações e alguns indicadores. Estará passando por todas as suas outras publicações em breve & # 8211; desculpe se isso já está publicado em algum lugar. THX.
Obrigado por compartilhar este código.
Uma pergunta rápida: com a atualização do código de dados existente, apenas atualizando as cotações mais recentes, os preços ajustados anteriores não seriam errados?
Só queria agradecer o amigo, sua ferramenta é realmente útil!
Oi ... Desculpe, postei esse comentário sob o artigo errado alguns segundos atrás. Por favor, ignore isso.
Obrigado pelo excelente artigo. Uma vez que questionar sobre a manutenção de arquivos de dados em arquivos CSV. No caso de um evento de ações como Split ou Dividend, os dados históricos vão mudar para refletir o evento. Como você detecta isso e atualiza seu arquivo CSV. Isso se torna desafiador se você tiver correções em seu arquivo CSV e você deve atualizar os dados históricos com novos dados do Yahoo ou seja o site da fonte.
Eu o que eu descrevo não me ajuste porque eu quero que os preços permaneçam como se fossem para refletir os resultados comerciais reais. Mas este é só eu, outras pessoas podem fazer as coisas de forma diferente. Na verdade, depende muito do seu estilo / estratégia comercial.
Obrigado por este artigo inspirador. Eu fiz algumas pequenas mudanças:
* Descarrega todos os dados de stock apenas se faltar o arquivo csv.
* Substitui período de lookback com atualizações (doesn & # 8217; t append)
* Usa a distância euclidiana dos preços adj. Para determinar se é necessário voltar a baixar todos os preços.

Análise Técnica com R.
Tabela de conteúdo.
Nesta publicação, veremos como um comerciante poderia usar R para calcular alguns indicadores básicos de Análise Técnica. R é um ambiente livre de análise estatística de código aberto e linguagem de programação. Está disponível para sistemas operacionais Windows, Mac OS e Linux. A instalação é fácil e rápida. Para instruções de download e instalação, vá para: cran. r-project.
Ao desenvolver uma estratégia comercial, é útil poder analisar e visualizar dados e poder testar suas regras de geração de comércio e suas variações e modelos rapidamente e com o mínimo de rotação. Enquanto muitas plataformas de negociação, como Interactive Brokers, etc. fornecem acesso a dados históricos via API ou download direto de arquivos e # 8211; Analisar essas estratégias de negociação de dados e protótipos muitas vezes requer escrever centenas de linhas de código em linguagens de programação, como Java ou C ++, ou escrever fórmulas complicadas difíceis de testar no Excel. Isso requer um investimento de tempo significativo, independentemente de como o programador de experiência você é. Em contraste, uma linguagem de programação de nível superior, como R ou Matlab, juntamente com seus ambientes de programação interativos, permite que seus usuários façam fatias, dados e analise dados dentro de uma fração de tempo que leva com C ++, C # ou Java. A quantidade de código necessária para desenvolver uma estratégia de negociação em R também é tipicamente uma ordem de grandeza.
Neste exemplo, usaremos um simples arquivo separado por vírgulas contendo colunas de preço aberto, alto, baixo e próximo (a. k.a. OHLC), juntamente com valores de volume e timestamp para SPY ETF. Nesta publicação, vamos demonstrar como usar uma biblioteca R gratuita para calcular os padrões da média movente simples (SMA), a média móvel exponencial (EMA), Bollinger Bands (BBands), RSI e MACD. Anexaremos indicadores calculados como novas colunas ao nosso arquivo de entrada para que ele possa ser usado para novas análises ou prototipagem de estratégia de negociação no Excel, R ou qualquer outro pacote de software compatível com CSV de sua escolha.
Biblioteca de Instalação de Análise Técnica para R.
1. Para calcular a Análise Técnica com R usaremos uma biblioteca livre de código aberto chamada & # 8220; TTR & # 8221; (Regras de Negociação Técnicas). Esta etapa inclui instruções para instalar a biblioteca TTR, supondo que você já tenha instalado R em seu computador. Este passo apenas precisa ser executado uma vez por instalação R em um computador.
Para instalar a biblioteca no seu computador:
1) Comece o ambiente R em seu computador e, no menu, selecione: Pacotes & # 038; Dados -> Instalador de Pacotes.
2) No tipo de Instalador de Pacotes & # 8220; TTR & # 8221; no campo Pesquisa de Pacotes e clique em & # 8220; Obter Lista & # 8221; botão.
3) Selecione o pacote & # 8220; TTR & # 8221; e clique em & # 8220; Instalar Selecionado & # 8221 ;.
Carregando dados históricos (entrada)
Para fins de demonstração, usaremos preços históricos diários para SPY ETF de setembro de 2018 a maio de 2018. Clique aqui para baixar o arquivo de dados. Este arquivo de entrada para este exemplo foi gerado usando o IB Historical Data Downloader.
2. Começamos abrindo o shell R e carregando a biblioteca "TTR", que é uma extensão R gratuita que contém funções para o cálculo de alguns dos indicadores mais comuns.
3. O próximo passo é importar nosso arquivo de dados com preços históricos para o ambiente R. Vamos carregar dados do arquivo CSV da amostra no ambiente R e armazená-lo como "quadro de dados", que é um tipo de variável R para armazenar dados no formato da tabela na memória.
Para exibir as primeiras linhas da tabela "dados":
Isso, por padrão, mostra as primeiras 6 linhas de dados, juntamente com os nomes das colunas (cabeçalho da tabela). Para ver quantas linhas você tem na tabela "dados":
Isso mostra que temos 187 registros de dados em nosso arquivo de dados SPY, para 187 dias de negociação entre 3 de setembro de 2018 e # 8211; 31 de maio de 2018.
Também podemos listar os nomes das colunas da tabela usando as funções "colnames" da seguinte maneira:
Médias móveis.
4. Vamos agora calcular a Média de Movimento Simples de 20 dias (SMA) da coluna de preço CLOSE usando a função R da biblioteca TTR "SMA":
Agora, vejamos os primeiros 50 valores da matriz "sma20":
Aqui, usamos a função SMA da biblioteca TTR que carregamos acima, dizendo para calcular a média de 20 dias (valor do parâmetro "n"), da coluna "CLOSE" da data frame "data". A função retorna uma matriz de valores de SMA e o armazena em uma nova variável chamada "sma20".
Você pode mostrar a ajuda com uma descrição detalhada da função e seus parâmetros estão sendo usados? seguido do nome da função, conforme abaixo. É sempre uma boa idéia ler páginas de ajuda para as funções que você está usando, pois listarão todos os parâmetros opcionais que você pode usar para ajustar a saída. Além disso, muitas funções têm variações ou funções relacionadas, o que pode ser útil em várias circunstâncias e será listado na página de ajuda.
5. O cálculo da Média de Movimento Exponencial é igualmente fácil, basta usar uma função diferente, desta vez EMA (). Observe que nós calculamos EMA por um período de 14 períodos.
Bandas de Bollinger.
6. Para calcular o indicador Bollinger Bands, usamos a função BBands. Há uma série de parâmetros opcionais que é necessário, então forneceremos vários exemplos. No exemplo abaixo, chamamos o BBands passando o quadro de dados "dados" com uma consulta que especifica que queremos usar valores da coluna "CLOSE", assim como fizemos acima os cálculos SMA e EMA acima. O segundo parâmetro 'sd' leva o número de desvios padrão para bandas superiores e inferiores. Como não passamos valor para 'n' & # 8211; O BBands usa a média móvel de 20 períodos por padrão. A saída contém várias colunas: 'dn' para a banda "inferior", 'mavg' para a média móvel, 'para cima' para a banda "superior" e pctB, que quantifica o preço de segurança em relação ao superior e Bollinger Band inferior, uma descrição detalhada disto pode ser encontrada aqui.
% B é igual a 1 quando o preço está na faixa superior% B é igual a 0 quando o preço está na faixa inferior% B está acima de 1 quando o preço está acima da banda superior% B está abaixo de 0 quando o preço está abaixo da faixa inferior% B está acima .50 quando o preço está acima da faixa do meio (SMA de 20 dias)% B está abaixo de .50 quando o preço está abaixo da faixa do meio (SMA de 20 dias)
> bb20 = BBands (dados, sd = 2,0)
6.1 Agora, gostaríamos de criar um novo quadro de dados contendo todos os dados de entrada a partir do & # 8216; dados & # 8217; quadro, mais dados Bollinger Bands que acabamos de calcular.
A função data. frame () leva qualquer número de quadros de dados e os junta em uma nova base de dados, de modo que os elementos das linhas correspondentes sejam "unidos" no resultado.
6.2 Bollinger Bands plot:
> linhas (dataPlusBB $ CLOSE, col = & # 8216; vermelho & # 8217;)
> linhas (dataPlusBB $ up, col = & # 8216; purple & # 8217;)
> linhas (dataPlusBB $ dn, col = & # 8216; brown & # 8217;)
> linhas (dataPlusBB $ mavg, col = & # 8216; blue & # 8217;)
6.3 Alternativamente, podemos especificar explicitamente que tipo de média móvel deve ser usado como base para Bollinger Bands usando o parâmetro de função 'maType', que simplesmente leva um nome de função de média móvel. Consulte a página de ajuda do SMA para ver diferentes tipos de médias móveis suportadas na biblioteca TTR. Por exemplo, se você quiser calcular um EMA Bollinger Bands, você pode passar EMA para maType. Observe que, neste exemplo, estamos substituindo o parâmetro de comprimento padrão para a média móvel, usando a média de 14 períodos desta vez.
> bbEMA = BBands (dados, sd = 2.0, n = 14, maType = EMA)
RSI & # 8211; Indicador de força relativa.
7. RSI. Para calcular o RSI, usamos a função RSI (). Você pode usar o comando RSI no shell R para obter detalhes dos parâmetros da função. Basicamente, é muito semelhante às funções que usamos acima para gerar médias móveis. Tem dois parâmetros necessários: séries temporais (como a coluna "FECHAR" da nossa base de dados "dados" e "número inteiro" para o "comprimento" do indicador RSI.
> rsi14 = RSI (dados, n = 14)
Aqui, o primeiro parâmetro para a função RSI é: dados, que é uma declaração que diz "pegue a coluna chamada 'FECHAR' da tabela 'dados' e devolva-a como uma lista de valores eo segundo parâmetro é n = 14, onde o nome do parâmetro é 'n' e o valor 14 indica que queremos calcular os valores de RSI de 14 dias nos preços de fechamento.
8. A função MACD leva vários argumentos:
séries de dados de entrada (como o preço "CLOSE") de períodos para a média móvel média "rápida" de períodos para a média móvel média "lenta" de períodos para a linha "sinal".
Você também pode opcionalmente especificar a função média móvel que você deseja usar para as médias móveis do MACD. Veja uma captura de tela da página de ajuda abaixo (você também pode usar o comando MACD no shell R para abrir a página de ajuda você mesmo):
Vamos calcular um padrão (12,26,9) indicador MACD usando esta função. Estaremos usando médias móveis simples padrão, então, especificaremos a função SMA no parâmetro 'maType':
> macd = MACD (data, nFast = 12, nSlow = 26, nSig = 9, maType = SMA)
Junte todos os dados juntos.
9. Agora, juntamos todos os indicadores calculados acima com os dados de entrada originais em um único quadro de dados:
A função data. frame () leva qualquer número de quadros de dados e os junta em fileira, de modo que os elementos das linhas correspondentes sejam "colados" juntos no data. frame resultante 'allData'.
Escreva no arquivo de texto.
E, finalmente, escrevemos o conteúdo da estrutura de dados 'allData' para um arquivo de valores separado por vírgulas. Usamos a função write. table (), que contém uma grande quantidade de parâmetros opcionais. Uma página de ajuda detalhada está disponível usando o comando "? Write. table" no shell R.
> write. table (allData, file = "spy_with_indicators. csv", na = "", sep = ",", row. names = FALSE)
Quando chamamos a função write. table (), passamos os seguintes argumentos:
AllData & # 8211; Esta é simplesmente uma referência ao quadro de dados que contém dados a serem gravados no arquivo de saída. arquivo = "& # 8230;" & # 8211; Este é o caminho e o nome do arquivo que estamos criando. na = "" & # 8211; certifica-se de que as células no quadro de dados que contenham o valor R "NA" conterão valores vazios no arquivo de saída. Algumas células têm NA para linhas onde não havia dados suficientes para gerar um valor indicador correspondente (por exemplo, as primeiras 19 linhas para SMA de 20 dias). sep = "," & # 8211; define o separador de colunas para vírgulas (portanto, o arquivo de valores separados por vírgulas). Para criar um arquivo separado por tabulação (realmente um formato preferido para sistemas de software sério) & # 8211; use: sep = "\ t". row. names = FALSE & # 8211; é importante definir esse valor, caso contrário, a primeira coluna no arquivo de saída conterá números de linha.
O arquivo resultante está disponível aqui. Clique com o botão direito do mouse e selecione & # 8220; Salvar arquivo vinculado como ... & # 8221; O arquivo baixado pode ser aberto no Excel ou no editor de texto.
10. Existem mais funções e recursos disponíveis na biblioteca "TTR". Você pode descobrir mais trazendo a página de ajuda da TTR:
CONCLUSÃO.
R fornece um ambiente conveniente e versátil para análise e cálculos de dados. Além de milhares de bibliotecas e algoritmos estatísticos, bibliotecas e algoritmos de código aberto gratuitos, R contém um grande número de funções e bibliotecas para ler e gravar dados de / para arquivos, bancos de dados, URLs, Serviços da Web, etc ... Isso, combinado com a concisão do idioma, é uma combinação poderosa que pode ajudar os comerciantes a economizar um tempo precioso. Os comerciantes podem reduzir significativamente o tempo necessário para protótipo e estratégias de negociação backtest usando R. Existem também métodos para integrar R com linguagens de programação convencionais, como Java e C ++. Não hesite em publicar um comentário ou enviar como uma mensagem através do formulário de contato, se você tiver alguma dúvida sobre este material.
Finalmente, gostaríamos de mencionar alguns livros que foram muito úteis em nossos esforços de desenvolvimento. O primeiro livro # 8211; & # 8220; Comércio Quantitativo com R & # 8221; é uma ótima combinação de insights de análise de dados financeiros e aplicação de R para backtesting, exploração de dados e análise. Tem uma série de ótimos exemplos de código e passa por uma série de pacotes R úteis. Este é um bom livro de nível de introdução para intermediário para pessoas que gostariam de construir e testar suas próprias estratégias de negociação.
O segundo livro # 8211; & # 8220; Mastering R for Quantitative Finance & # 8221; & # 8211; é uma verdadeira jóia. Contém informações mais avançadas para os comerciantes com uma boa compreensão dos instrumentos derivados e um fundo matemático mais forte. Descobrimos que este livro é um ótimo acompanhamento para o & # 8220; Quantitative Trading com R & # 8221 ;. Além de grandes exemplos e pacotes de código R, ele contém visões gerais de vários modelos e algoritmos de financiamento quantitativos avançados (e práticos!) E permite que você fique com os pés molhados com o código R imediatamente.
8 comentários sobre o & ldquo; Análise técnica com R & rdquo;
Ótimo post! Obrigado.
1) você pode usar os dados baixados para fazer gráficos, com os indicadores ou osciladores?
2) outros outros parâmetros podem ser usados para pesquisar os candidatos certos? Eu não quero milhares de ações para examinar.
3) é esta uma tela de pesquisa ou os estoques devem ser inseridos manualmente?
4) todos os critérios de pesquisa serão atualizados automaticamente?
5) outras questões, mas estas parecem as mais relevantes neste momento.
Você fez todo o trabalho fazendo todo esse trabalho.
Existe a possibilidade de que eu possa fazer você ajustar algumas coisas no MACD?
Sim, você pode definir todos os dados da série temporal em R, incluindo indicadores, de forma semelhante ao exemplo do gráfico Bollinger Bands na minha publicação.
uau, isso é realmente muito melhor do que muitas outras coisas que eu li tentando entender como construir minha própria plataforma de negociação, eu posso ter controle sobre. Seria ótimo se houvesse um guia de teste de volta também.
Obrigado! Eu ficarei feliz em discutir backtesting e responder suas perguntas se você me deixar uma linha através do formulário de contato no lado direito.
Obrigado por compartilhar o link para a página do tutorial, publicação educativa aqui, por sinal.
É possível para mim criar meu próprio indicador personalizado e usar isso com o quantmod?
Sim, você tem requisitos para o indicador personalizado? Podemos ajudá-lo com o desenvolvimento.
Suporte Geeks de negociação.
Deixe uma resposta Cancelar resposta.
IB Data Downloader.
O IB Data Downloader versão 3.3 está agora disponível! Faça o download de dados históricos da Interactive Brokers. Ações, Futuros, ETFs, Índices, Forex, Opções, FOPs. Agora suporta downloads de dados históricos de opções! Executa no Windows, MacOS, Linux. Manipula automaticamente as violações de estimulação da API IB, sem restrições de duração devido a limitações de estimulação. Apoia dados históricos para contratos de futuros expirados.
IB Excel Trader.
IB Excel Trader versão 1.6 está agora disponível! Trade Stocks, ETFs, Futuros e Forex diretamente do Excel. Implementar regras comerciais comerciais usando fórmulas de planilha ou VBA. Regras de entrada do programa para ordens de saída únicas ou de suporte. Mercado, Stop, Limite, Stop-Limit, além de encomendas complexas complexas são suportadas. Folha de registro de pedidos (novo!). Contém uma lista detalhada de cada alteração de status do pedido em uma tabela Excel filtrável. Use o nosso Serviço de personalização para expandir o IB Excel Trader e contratar nossos programadores para desenvolver suas estratégias comerciais comerciais.
O Interactive Brokers (IB) é um fornecedor de baixo custo de serviços de execução comercial e de compensação para indivíduos, conselheiros, grupos comerciais, corretores e hedge funds. A principal tecnologia do IB oferece acesso direto a ações, opções, futuros, divisas, títulos e fundos em mais de 100 mercados em todo o mundo a partir de uma única conta universal do IB.
Membro NYSE, FINRA, SIPC. Visite os roteiros interativos para obter mais informações.
Postagens recentes.
Contate-Nos!
Mensagem enviada.
Obrigado por contatar os Geeks comerciais. Nós responderemos a sua mensagem em breve. Entretanto, se você tiver alguma dúvida adicional, não hesite em nos enviar um e-mail para: contatos @ tradinggeeks.
Desculpe, houve um problema e sua mensagem não foi enviada.
Digite seus detalhes de contato e uma breve mensagem abaixo e nós responderemos sua mensagem em breve.

R cran forex
Obter através da App Store Leia esta publicação em nosso aplicativo!
Como obter taxas de câmbio em R.
Existem pacotes / funções R para obter taxas de câmbio em tempo real, p. do Google Finance? Preferiria evitar o RCurl ou outros analisadores se algo já estiver lá.
Especificamente, vetores dados de símbolos de moeda "de" e "para", eu gostaria de conhecer as taxas. Algo como:
Você pode usar o quantmod para obter as citações do yahoo. (Não tenho certeza de quão atrasadas as citações de Yahoo do Yahoo são ou com que frequência elas estão atualizadas.)
Ou TFX para cotações timestamped em tempo real, em milissegundos se você se inscrever para uma conta gratuita. (note-se que você deve usar a convenção do mercado, ou seja, USD / JPY em vez de JPY / USD)
Ou se você possui uma conta Interactive Brokers, você pode usar o pacote IBrokers, ou o meu pacote TwoInstrument (que é basicamente apenas wrappers para funções do IBrokers)
Parece que TFX e quantmod têm funções para isso (graças a @RStudent e @KFB para as dicas). Eu preferia o quantmod, uma vez que não exigia a configuração de uma conta, mas AFAICT não existe uma função de instantâneo instantâneo vectorizada como o que estou procurando. Esta função GetExchangeRates faz isso:

O R Trader.
Usando R e ferramentas relacionadas em Finanças Quantitativas.
Arquivo para a & # 8216; Data Science & # 8217; Categoria.
Visualizando dados da série temporal em R.
Estou muito satisfeito em anunciar o meu curso DataCamp sobre Visualização de Dados da Série Temporal em R. Este curso também faz parte da série Time com R habilidades. Sinta-se livre para dar uma olhada, o primeiro capítulo é gratuito!
Descrição do Curso.
Como diz o ditado, "Um gráfico vale mais que mil palavras". É por isso que a visualização é a maneira mais utilizada e poderosa de obter uma melhor compreensão dos seus dados. Após este curso, você terá uma ótima visão geral das capacidades de visualização da série R e você poderá decidir melhor o modelo a ser escolhido para análise subseqüente. Você também poderá transmitir a mensagem que deseja entregar de forma eficiente e linda.
Esboço de Curso.
Capítulo 1: R Time Series Visualization Tools.
Este capítulo irá apresentá-lo às ferramentas básicas de visualização da série R.
Capítulo 2: séries temporais univariadas.
Os gráficos univariados são projetados para aprender o máximo possível sobre a distribuição, a tendência central e a disseminação dos dados em questão. Neste capítulo, você receberá algumas ferramentas visuais usadas para diagnosticar séries de tempos univariados.
Capítulo 3: séries temporais multivariadas.
O que fazer se você tiver que lidar com séries temporais multivariadas? Neste capítulo, você aprenderá como identificar padrões na distribuição, tendência central e propagação em pares ou grupos de dados.
Capítulo 4: Estudo de caso: selecionando visualmente um estoque que melhora sua carteira existente.
Deixe colocar tudo o que aprendeu até agora na prática! Imagine que você já possui um portfólio de ações e você tem algum dinheiro extra para investir, como você pode escolher com sabedoria um novo estoque para investir seu dinheiro adicional? Analisar as propriedades estatísticas das ações individuais versus um portfólio existente é uma boa maneira de abordar o problema.
Vinculando R para IQFeed com o pacote QuantTools.
O IQFeed fornece serviços de transmissão de dados e soluções de negociação que cobrem o mercado agrícola, energético e financeiro. É um fornecedor bem conhecido e reconhecido de feed de dados voltado para usuários de varejo e pequenas instituições. O preço da assinatura começa em torno de US $ 80 / mês.
Stanislav Kovalevsky desenvolveu um pacote chamado QuantTools. É um pacote tudo em um projetado para melhorar a modelagem de negociação quantitativa. Ele permite baixar e organizar dados históricos de mercado de várias fontes como Yahoo, Google, Finam, MOEX e IQFeed. O recurso que mais me interessa é a capacidade de vincular o IQFeed à R. I & # 8217; tenho usado o IQFeed há alguns anos e estou feliz com ele (eu não sou afiliado à empresa em nenhum caminho). Mais informações podem ser encontradas aqui. Eu procurei uma integração dentro de R por um tempo e aqui está. Como resultado, depois de executar alguns testes, mudei meu código que ainda estava em Python em R. Apenas por completude, aqui é um link que explica como baixar dados históricos do IQFeed usando o Python.
O QuantTools oferece quatro funcionalidades principais: Obter dados de mercado, armazenar / recuperar dados do mercado, traçar dados da série temporal e testar as costas.
Primeiro, certifique-se de que o IQfeed esteja aberto. Você pode baixar dados diários ou intraday. O código abaixo baixa os preços diários (Open, High, Low, Close) para a SPY de 1 de janeiro de 2017 a 1 de junho de 2017.
O código abaixo baixa dados intraday de 1 de maio de 2017 a 3 de maio de 2017.
Observe o parâmetro do período. Pode levar qualquer um dos seguintes valores: tick, 1min, 5min, 10min, 15min, 30min, hora, dia, semana, mês, dependendo da frequência que você precisa.
O QuantTools torna o processo de gerenciamento e armazenamento de dados do mercado de tiques fácil. Você apenas configura parâmetros de armazenamento e está pronto para ir. Os parâmetros são onde, desde que data e quais símbolos você gostaria de ser armazenado. Sempre que você pode adicionar mais símbolos e se eles não estiverem presentes em um armazenamento, o QuantTools tenta obter os dados da data de início especificada. O código abaixo salvará os dados no seguinte diretório: & # 8220; C: / Usuários / Arnaud / Documents / Market Data / iqfeed & # 8221 ;. Existe uma sub-pasta por instrumento e os dados são aved em arquivos. rds.
Você também pode armazenar dados entre datas específicas. Substitua a última linha de código acima com uma das seguintes.
Agora, você deseja recuperar alguns dos dados armazenados, basta executar algo como:
Observe que apenas os tiques são suportados no armazenamento local, pelo que o período deve ser & # 8216; assinalar & # 8217;
O QuantTools fornece a função plot_ts para traçar dados da série temporal sem fins de semana, feriados e intervalos overnight. No exemplo abaixo, primeiro recupero os dados armazenados acima, selecione as primeiras 100 observações de preços e, finalmente, desenhe o gráfico.
Duas coisas a notar: primeiro espião é um objeto data. table daí a sintaxe acima. Para obter uma visão geral rápida das capacidades de data. table, veja esta excelente folha de truques da DataCamp. Segundo, o parâmetro local é VERDADEIRO à medida que os dados são recuperados do armazenamento interno.
O QuantTools permite escrever sua própria estratégia comercial usando sua API C ++. Eu não vou elaborar sobre isso, pois este é basicamente o código C ++. Você pode consultar a seção Exemplos no site QuantTools.
No geral, considero o pacote extremamente útil e bem documentado. O único bit faltante é o feed ao vivo entre R e IQFeed, o que tornará o pacote uma solução de fim a fim real.
Como de costume, todos os comentários são bem-vindos.
BERT: um recém-chegado na conexão do R Excel.
Alguns meses atrás, um leitor me apontou essa nova maneira de conectar R e Excel. Eu não sei por quanto tempo isso aconteceu, mas nunca encontrei isso e eu nunca vi nenhuma postagem no blog ou artigo sobre isso. Então eu decidi escrever uma publicação, pois a ferramenta realmente vale a pena e, antes que alguém pergunte, eu não estou relacionado à empresa de nenhuma maneira.
BERT significa Basic Excel R Toolkit. É grátis (licenciado sob a GPL v2) e foi desenvolvido pela Structured Data LLC. No momento da redação, a versão atual do BERT é 1.07. Mais informações podem ser encontradas aqui. De uma perspectiva mais técnica, o BERT foi projetado para suportar a execução de funções R a partir de células da planilha do Excel. Em termos de Excel, ele é para escrever funções definidas pelo usuário (UDFs) em R.
Nesta publicação, não vou mostrar-lhe como o R e o Excel interagem através do BERT. Há muito bons tutoriais aqui, aqui e aqui. Em vez disso, quero mostrar-lhe como usei o BERT para criar uma torre de controle # 8222; para minha negociação.
Meus sinais comerciais são gerados usando uma longa lista de arquivos R, mas eu preciso da flexibilidade do Excel para exibir resultados de forma rápida e eficiente. Como mostrado acima, o BERT pode fazer isso por mim, mas eu também quero adaptar o aplicativo às minhas necessidades. Ao combinar o poder de XML, VBA, R e BERT, posso criar uma aplicação bem parecida e poderosa na forma de um arquivo Excel com código VBA mínimo. Em última análise, tenho um único arquivo do Excel reunindo todas as tarefas necessárias para gerenciar meu portfólio: atualização do banco de dados, geração de sinal, envio de ordens etc e # 8230; Minha abordagem poderia ser dividida nas 3 etapas abaixo:
Use XML para criar menus e botões definidos pelo usuário em um arquivo do Excel. Os menus e botões acima são essencialmente chamadas para funções VBA. Essas funções VBA estão envolvidas em torno de funções R definidas usando o BERT.
Com esta abordagem, posso manter uma distinção clara entre o núcleo do meu código mantido em R, SQL e Python e tudo usado para exibir e formatar resultados mantidos no Excel, VBA e amp; XML. Nas próximas seções, apresento o pré-requisito para desenvolver essa abordagem e um guia passo a passo que explica como o BERT poderia ser usado para simplesmente passar dados de R para Excel com um código mínimo de VBA.
1 & # 8211; Baixe e instale o BERT a partir deste link. Uma vez que a instalação foi concluída, você deve ter um novo menu de suplementos no Excel com os botões como mostrado abaixo. É assim que o BERT se materializou no Excel.
2 & # 8211; Baixe e instale o editor de UI personalizado: O Editor de UI personalizado permite criar menus e botões definidos pelo usuário na faixa de Excel. Um procedimento passo a passo está disponível aqui.
1 & # 8211; Código R: A função R abaixo é um código muito simples apenas para fins ilustrativos. Ele calcula e retorna os resíduos de uma regressão linear. Isto é o que queremos recuperar no Excel. Salve isso em um arquivo chamado myRCode. R (qualquer outro nome está bem) em um diretório de sua escolha.
2 & # 8211; functions. R em BERT: do Excel, selecione Add-Ins - & gt; Diretório inicial e abra o arquivo chamado functions. R. Neste arquivo cole o seguinte código. Certifique-se de inserir o caminho correto.
Isso está apenas fornecendo o arquivo RERT que você criou acima. Em seguida, salve e feche as funções do arquivo. R. Se você quiser fazer alguma alteração no arquivo R criado na etapa 1, você terá que recarregá-lo usando o botão BERT & # 8220; Recarregar arquivo de inicialização e # 8221; no menu Complementos no Excel.
3 & # 8211; No Excel: Crie e salve um arquivo chamado myFile. xslm (qualquer outro nome está bem). Este é um arquivo ativado por macro que você salva no diretório de sua escolha. Uma vez que o arquivo é salvo, feche-o.
4 & # 8211; Abra o arquivo criado acima no editor UI personalizado: depois que o arquivo estiver aberto, cole o código abaixo.
Você deve ter algo assim no editor XML:
Essencialmente, essa parte do código XML cria um menu adicional (RTrader), um novo grupo (Meu Grupo) e um botão definido pelo usuário (Novo botão) na faixa do Excel. Depois de concluir, abra myFile. xslm no Excel e feche o Editor de UI personalizado. Você deve ver algo assim.
5 & # 8211; Abra o editor VBA: no myFile. xlsm insira um novo módulo. Cole o código abaixo no módulo recém-criado.
Isso apaga os resultados anteriores na planilha antes de lidar com novos.
6 & # 8211; Clique no botão Novo: Agora volte para a planilha e no menu do RTrader clique no & # 8220; Novo botão & # 8221; botão. Você deve ver algo como o que aparece abaixo.
O guia acima é uma versão muito básica do que pode ser alcançado usando o BERT, mas mostra como combinar o poder de várias ferramentas específicas para criar sua própria aplicação personalizada. Do meu ponto de vista, o interesse de tal abordagem é a capacidade de colar R e Excel, obviamente, mas também para incluir via XML (e lote) partes de código de Python, SQL e muito mais. Isso é exatamente o que eu precisava. Finalmente, ficaria curioso para saber se alguém tem alguma experiência com o BERT?
Estratégia de negociação: aproveitando ao máximo os dados da amostra.
Ao testar as estratégias de negociação, uma abordagem comum é dividir o conjunto de dados inicial em dados de amostra: a parte dos dados projetados para calibrar o modelo e fora dos dados de amostra: a parte dos dados utilizados para validar a calibração e garantir que o desempenho criado na amostra será refletido no mundo real. Como regra geral, cerca de 70% dos dados iniciais podem ser utilizados para calibração (isto é, na amostra) e 30% para validação (isto é, fora da amostra). Em seguida, uma comparação dos dados de entrada e saída da amostra ajuda a decidir se o modelo é robusto o suficiente. Esta publicação pretende dar um passo adiante e fornece um método estatístico para decidir se os dados fora da amostra estão alinhados com o que foi criado na amostra.
No gráfico abaixo, a área azul representa o desempenho fora da amostra para uma das minhas estratégias.
Uma simples inspeção visual revela um bom ajuste entre o desempenho dentro e fora da amostra, mas o grau de confiança que tenho nisso? Nesta fase não muito e esta é a questão. O que é realmente necessário é uma medida de similaridade entre os conjuntos de dados dentro e fora da amostra. Em termos estatísticos, isso pode ser traduzido como a probabilidade de os números de desempenho dentro e fora da amostra serem provenientes da mesma distribuição. Existe um teste estatístico não paramétrico que faz exatamente isso: o teste Kruskall-Wallis. Uma boa definição deste teste pode ser encontrada no R-Tutor & # 8220; Uma coleção de amostras de dados são independentes se elas vierem de populações não relacionadas e as amostras não se afetam. Usando o teste de Kruskal-Wallis, podemos decidir se as distribuições de população são idênticas sem assumir que elas sigam a distribuição normal. & # 8221; O benefício adicional deste teste não está assumindo uma distribuição normal.
Existe outros testes da mesma natureza que podem enquadrar-se nesse quadro. O teste de Mann-Whitney-Wilcoxon ou os testes de Kolmogorov-Smirnov adequam-se perfeitamente à estrutura descreve aqui no entanto, isso está além do escopo deste artigo para discutir os prós e contras de cada um desses testes. Uma boa descrição junto com exemplos R podem ser encontradas aqui.
Aqui, o código usado para gerar o gráfico acima e a análise:
No exemplo acima, o período de amostra é mais longo do que o período fora da amostra, portanto, criei aleatoriamente 1000 subconjuntos dos dados de amostra, cada um deles com o mesmo comprimento que os dados fora da amostra. Então eu testei cada um em subconjunto de amostra contra os dados fora da amostra e gravei os valores p. Este processo não cria um único valor de p para o teste de Kruskall-Wallis, mas uma distribuição que torna a análise mais robusta. Neste exemplo, a média dos valores de p é bem acima de zero (0.478) indicando que a hipótese nula deve ser aceita: existem fortes evidências de que os dados dentro e fora da amostra são provenientes da mesma distribuição.
Como de costume, o que é apresentado nesta publicação é um exemplo de brinquedo que apenas arranha a superfície do problema e deve ser adaptado às necessidades individuais. No entanto, acho que propõe um quadro estatístico interessante e racional para avaliar os resultados da amostra.
Esta publicação é inspirada nos dois artigos seguintes:
Vigier Alexandre, Chmil Swann (2007), "Efeitos de várias funções de otimização sobre o desempenho da amostra de estratégias de negociação desenvolvidas genéticamente", Conferência de mercados financeiros de previsão.
Vigier Alexandre, Chmil Swann (2018), "Um processo de otimização para melhorar dentro / fora da consistência da amostra, um caso do mercado de ações", JP Morgan Cazenove Equity Quantitative Conference, Londres, outubro de 2018.
Apresentando fidlr: FInancial Data LoadeR.
fidlr é um complemento do RStudio projetado para simplificar o processo de download de dados financeiros de vários provedores. Esta versão inicial é um invólucro em torno da função getSymbols no pacote quantmod e apenas o Yahoo, Google, FRED e Oanda são suportados. Provavelmente vou adicionar funcionalidades ao longo do tempo. Como de costume com essas coisas apenas um lembrete amável: & # 8220; O SOFTWARE É FORNECIDO & # 8220; COMO ESTÁ & # 8221 ;, SEM GARANTIA DE QUALQUER TIPO & # 8230; & # 8221;
Como instalar e usar o fidlr?
Você pode obter o addin / pacote de seu repositório Github aqui (Eu vou registrá-lo em CRAN mais tarde) Instale o addin. Existe um excelente tutorial para instalar o RStudio Addins aqui. Uma vez que o addin está instalado, ele deve aparecer no menu Addin. Basta escolher fidlr no menu e uma janela como ilustrada abaixo deve aparecer. Escolha um fornecedor de dados no menu suspenso Origem. Selecione um intervalo de datas no menu Data Digite o símbolo que deseja baixar na caixa de texto do instrumento. Para baixar vários símbolos, basta inserir os símbolos separados por vírgulas. Use os botões de rádio para escolher se deseja baixar o instrumento em um arquivo csv ou no ambiente global. O arquivo csv será salvo no diretório de trabalho e haverá um arquivo csv por instrumento. Pressione Executar para obter os dados ou Fechar para fechar o addin.
Mensagens de erro e avisos são tratados pelos pacotes subjacentes (quantmod e Shiny) e podem ser lidos a partir do console.
Esta é uma primeira versão do projeto, então não espere perfeição, mas espero que melhore com o tempo. Informe qualquer comentário, sugestão, erro, etc. & # 8230; para: thertrader @ gmail.
Mantendo um banco de dados de arquivos de preços em R.
Fazer pesquisas quantitativas implica uma grande quantidade de dados crunching e um precisa de dados limpos e confiáveis para conseguir isso. O que é realmente necessário é a limpeza de dados facilmente acessíveis (mesmo sem conexão à internet). A maneira mais eficiente de fazer isso por mim tem sido manter um conjunto de arquivos csv. Obviamente, esse processo pode ser tratado de várias maneiras, mas eu encontrei horas extras muito eficientes e simples para manter um diretório onde eu armazeno e atualize arquivos csv. Eu tenho um arquivo csv por instrumento e cada arquivo é nomeado após o instrumento que ele contém. The reason I do so is twofold: First, I don’t want to download (price) data from Yahoo, Google etc… every time I want to test a new idea but more importantly once I identified and fixed a problem, I don’t want to have to do it again the next time I need the same instrument. Simple yet very efficient so far. The process is summarized in the chart below.
In everything that follows, I assume that data is coming from Yahoo. The code will have to be amended for data from Google, Quandl etc… In addition I present the process of updating daily price data. The setup will be different for higher frequency data and other type of dataset (i. e. different from prices).
1 & # 8211; Initial data downloading (listOfInstruments. R & historicalData. R)
The file listOfInstruments. R is a file containing only the list of all instruments.
If an instrument isn’t part of my list (i. e. no csv file in my data folder) or if you do it for the very first time you have to download the initial historical data set. The example below downloads a set of ETFs daily prices from Yahoo Finance back to January 2000 and store the data in a csv file.
2 & # 8211; Update existing data (updateData. R)
The below code starts from existing files in the dedicated folder and updates all of them one after the other. I usually run this process everyday except when I’m on holiday. To add a new instrument, simply run step 1 above for this instrument alone.
3 & # 8211; Create a batch file (updateDailyPrices. bat)
Another important part of the job is creating a batch file that automates the updating process above (I’m a Windows user). This avoids opening R/RStudio and run the code from there. The code below is placed on a. bat file (the path has to be amended with the reader’s setup). Note that I added an output file (updateLog. txt) to track the execution.
The process above is extremely simple because it only describes how to update daily price data. I’ve been using this for a while and it has been working very smoothly for me so far. For more advanced data and/or higher frequencies, things can get much trickier.
As usual any comments welcome.
Factor Evaluation in Quantitative Portfolio Management.
When it comes to managing a portfolio of stocks versus a benchmark the problem is very different from defining an absolute return strategy. In the former one has to hold more stocks than in the later where no stocks at all can be held if there is not good enough opportunity. The reason for that is the tracking error . This is defined as the standard deviation of the portfolio return minus the benchmark return. The less stocks is held vs. a benchmark the higher the tracking error (e. g higher risk).
The analysis that follows is largely inspired by the book “Active Portfolio Management” by Grinold & Kahn. This is the bible for anyone interested in running a portfolio against a benchmark. I strongly encourage anyone with an interest in the topic to read the book from the beginning to the end. It’s very well written and lays the foundations of systematic active portfolio management (I have no affiliation to the editor or the authors).
Here we’re trying to rank as accurately as possible the stocks in the investment universe on a forward return basis. Many people came up with many tools and countless variant of those tools have been developed to achieve this. In this post I focus on two simple and widely used metrics: Information Coefficient (IC) and Quantiles Return (QR).
The IC gives an overview of the factor forecasting ability. More precisely, this is a measure of how well the factor ranks the stocks on a forward return basis. The IC is defined as the rank correlation ( ρ ) between the metric (e. g. factor) and the forward return. In statistical terms the rank correlation is a nonparametric measure of dependance between two variables. For a sample of size n , the n raw scores are converted to ranks , and ρ is computed from:
The horizon for the forward return has to be defined by the analyst and it’s a function of the strategy’s turnover and the alpha decay (this has been the subject of extensive research). Obviously ICs must be as high as possible in absolute terms.
For the keen reader, in the book by Grinold & Kahn a formula linking Information Ratio (IR) and IC is given: with breadth being the number of independent bets (trades). This formula is known as the fundamental law of active management . The problem is that often, defining breadth accurately is not as easy as it sounds.
In order to have a more accurate estimate of the factor predictive power it’s necessary to go a step further and group stocks by quantile of factor values then analyse the average forward return (or any other central tendency metric) of each of those quantiles. The usefulness of this tool is straightforward. A factor can have a good IC but its predictive power might be limited to a small number of stocks. This is not good as a portfolio manager will have to pick stocks within the entire universe in order to meet its tracking error constraint. Good quantiles return are characterised by a monotonous relationship between the individual quantiles and forward returns.
All the stocks in the S&P500 index (at the time of writing). Obviously there is a survival ship bias: the list of stocks in the index has changed significantly between the start and the end of the sample period, however it’s good enough for illustration purposes only.
The code below downloads individual stock prices in the S&P500 between Jan 2005 and today (it takes a while) and turns the raw prices into return over the last 12 months and the last month. The former is our factor, the latter will be used as the forward return measure.
Below is the code to compute Information Coefficient and Quantiles Return. Note that I used quintiles in this example but any other grouping method (terciles, deciles etc…) can be used. it really depends on the sample size, what you want to capture and wether you want to have a broad overview or focus on distribution tails. For estimating returns within each quintile, median has been used as the central tendency estimator. This measure is much less sensitive to outliers than arithmetic mean.
And finally the code to produce the Quantiles Return chart.
3 & # 8211; How to exploit the information above?
In the chart above Q1 is lowest past 12 months return and Q5 highest. There is an almost monotonic increase in the quantiles return between Q1 and Q5 which clearly indicates that stocks falling into Q5 outperform those falling into Q1 by about 1% per month. This is very significant and powerful for such a simple factor (not really a surprise though…). Therefore there are greater chances to beat the index by overweighting the stocks falling into Q5 and underweighting those falling into Q1 relative to the benchmark.
An IC of 0.0206 might not mean a great deal in itself but it’s significantly different from 0 and indicates a good predictive power of the past 12 months return overall. Formal significance tests can be evaluated but this is beyond the scope of this article.
The above framework is excellent for evaluating investments factor’s quality however there are a number of practical limitations that have to be addressed for real life implementation:
Rebalancing : In the description above, it’s assumed that at the end of each month the portfolio is fully rebalanced. This means all stocks falling in Q1 are underweight and all stocks falling in Q5 are overweight relative to the benchmark. This is not always possible for practical reasons: some stocks might be excluded from the investment universe, there are constraints on industry or sector weight, there are constraints on turnover etc… Transaction Costs : This has not be taken into account in the analysis above and this is a serious brake to real life implementation. Turnover considerations are usually implemented in real life in a form of penalty on factor quality. Transfer coefficient : This is an extension of the fundamental law of active management and it relaxes the assumption of Grinold’s model that managers face no constraints which preclude them from translating their investments insights directly into portfolio bets.
And finally, I’m amazed by what can be achieved in less than 80 lines of code with R…
As usual any comments welcome.
A Simple Shiny App for Monitoring Trading Strategies.
In a previous post I showed how to use R, Knitr and LaTeX to build a template strategy report. This post goes a step further by making the analysis interactive. Besides the interactivity, the Shiny App also solves two problems :
I can now access all my trading strategies from a single point regardless of the instrument traded. Coupled with the Shiny interactivity, it allows easier comparison. I can focus on a specific time period.
The code used in this post is available on a Gist/Github repository. There are essentially 3 files.
ui. R : controls the layout and appearance of the app. server. R : contains the instructions needed to build the app. It loads the data and format it. There is one csv file per strategy each containing at least two columns: date and return with the following format: (“2018-12-22″,”0.04%” ). You can load as much strategies as you want as long as they have the right format. shinyStrategyG eneral. R : loads the required packages and launches the app.
This app is probably far from perfect and I will certainly improve it in the future. Feel free to get in touch should you have any suggestion.
A big thank you to the RStudio/Shiny team for such a great tool.
Usando Algoritmos Genéticos em Negociação Quantitativa.
The question one should always asked him/herself when using technical indicators is what would be an objective criteria to select indicators parameters (e. g., why using a 14 days RSI rather than 15 or 20 days?). Genetic algorithms (GA) are well suited tools to answer that question. In this post I’ll show you how to set up the problem in R. Before I proceed the usual reminder: What I present in this post is just a toy example and not an invitation to invest. It’s not a finished strategy either but a research idea that needs to be further researched, developed and tailored to individual needs.
What are genetic algorithms?
The best description of GA I came across comes from Cybernatic Trading a book by Murray A. Ruggiero. “Genetic Algorithms were invented by John Holland in the mid-1970 to solve hard optimisation problems. This method uses natural selection, survival of the fittest”. The general process follows the steps below:
Encode the problem into chromosomes Using the encoding, develop a fitness function for use in evaluating each chromosome’s value in solving a given problem Initialize a population of chromosomes Evaluate each chromosome in the population Create new chromosomes by mating two chromosomes. This is done by muting and recombining two parents to form two children (parents are selected randomly but biased by their fitness) Evaluate the new chromosome Delete a member of the population that is less fit than the new chromosome and insert the new chromosome in the population. If the stop criteria is reached (maximum number of generations, fitness criteria is good enough…) then return the best chromosome alternatively go to step 4.
From a trading perspective GA are very useful because they are good at dealing with highly nonlinear problems. However they exhibit some nasty features that are worth mentioning:
Over fitting: This is the main problem and it’s down to the analyst to set up the problem in a way that minimises this risk. Computing time : If the problem isn’t properly defined, it can be extremely long to reach a decent solution and the complexity increases exponentially with the number of variables. Hence the necessity to carefully select the parameters.
There are several R packages dealing with GA, I chose to use the most common one: rgenoud.
Daily closing prices for most liquid ETFs from Yahoo finance going back to January 2000. The in sample period goes from January 2000 to December 2018. The Out of sample period starts on January 2018.
The logic is as following: the fitness function is optimised over the in sample period to obtain a set of optimal parameters for the selected technical indicators. The performance of those indicators is then evaluated in the out of sample period. But before doing so the technical indicators have to be selected.
The equity market exhibits two main characteristics that are familiar to anyone with some trading experience. Long term momentum and short term reversal. Those features can be translated in term of technical indicators by: moving averages cross over and RSI. This represents a set of 4 parameters: Look-back periods for long and short term moving averages, look-back period for RSI and RSI threshold. The sets of parameters are the chromosomes . The other key element is the fitness function . We might want to use something like: maximum return or Sharpe ratio or minimum average Drawdown. In what follows, I chose to maximise the Sharpe ratio.
The R implementation is a set of 3 functions:
fitnessFunction : defines the fitness function (e. g., maximum Sharpe ratio) to be used within the GA engine tradingStatistics : summary of trading statistics for the in and out of sample periods for comparison purposes genoud : the GA engine from the rgenoud package.
The genoud function is rather complex but I’m not going to explain what each parameter means as I want to keep this post short (and the documentation is really good).
In the table below I present for each instrument the optimal parameters (RSI look-back period, RSI threshold, Short Term Moving Average, and Long Term Moving Average) along with the in and out of sample trading statistics.
Before commenting the above results, I want to explain a few important points. To match the logic defined above, I bounded the parameters to make sure the look-back period for the long term moving average is always longer that the shorter moving average. I also constrained the optimiser to choose only the solutions with more than 50 trades in the in sample period (e. g;, statistical significance).
Overall the out of sample results are far from impressive. The returns are low even if the number of trades is small to make the outcome really significant. However there’s a significant loss of efficiency between in and out of sample period for Japan (EWJ) which very likely means over fitting.
This post is intended to give the reader the tools to properly use GA in a quantitative trading framework. Once again, It’s just an example that needs to be further refined. A few potential improvement to explore would be:
fitness function : maximising the Sharpe ratio is very simplistic. A “smarter” function would certainly improve the out of sample trading statistics pattern : we try to capture a very straightforward pattern. A more in depth pattern research is definitely needed. optimisation : there are many ways to improve the way the optimisation is conducted. This would improve both the computation speed and the rationality of the results.
The code used in this post is available on a Gist repository.
As usual any comments welcome.
Using CART for Stock Market Forecasting.
There is an enormous body of literature both academic and empirical about market forecasting. Most of the time it mixes two market features: Magnitude and Direction. In this article I want to focus on identifying the market direction only. The goal I set myself, is to identify market conditions when the odds are significantly biased toward an up or a down market. This post gives an example of how CART (Classification And Regression Trees) can be used in this context. Before I proceed the usual reminder: What I present in this post is just a toy example and not an invitation to invest. It’s not a finished strategy either but a research idea that needs to be further researched, developed and tailored to individual needs.
1 & # 8211; What is CART and why using it?
From statistics, CART are a set of techniques for classification and prediction. The technique is aimed at producing rules that predict the value of an outcome (target) variable from known values of predictor (explanatory) variables. There are many different implementations but they are all sharing a general characteristic and that’s what I’m interested in. From Wikipedia, “Algorithms for constructing decision trees usually work top-down, by choosing a variable at each step that best splits the set of items. Different algorithms use different metrics for measuring “best”. These generally measure the homogeneity of the target variable within the subsets. These metrics are applied to each candidate subset, and the resulting values are combined (e. g., averaged) to provide a measure of the quality of the split”.
CART methodology exhibits some characteristics that are very well suited for market analysis:
Non parametric : CART can handle any type of statistical distributions Non linear : CART can handle a large spectrum of dependency between variables (e. g., not limited to linear relationships) Robust to outliers.
There are various R packages dealing with Recursive Partitioning, I use here rpart for trees estimation and rpart. plot for trees drawing.
2 & # 8211; Dados & amp; Experiment Design.
Daily OHLC prices for most liquid ETFs from January 2000 to December 2018 extracted from Google finance. The in sample period goes from January 2000 to December 2018; the rest of the dataset is the out of sample period. Before running any type of analysis the dataset has to be prepared for the task.
The target variable is the ETF weekly forward return defined as a two states of the world outcome (UP or DOWN). If weekly forward return > 0 then the market in the UP state, DOWN state otherwise.
The explanatory variables are a set of technical indicators derived from the initial daily OHLC dataset. Each indicator represents a well-documented market behavior. In order to reduce the noise in the data and to try to identify robust relationships, each independent variable is considered to have a binary outcome.
Volatility (VAR1) : High volatility is usually associated with a down market and low volatility with an up market. Volatility is defined as the 20 days raw ATR (Average True Range) spread to its moving average (MA). If raw ATR > MA then VAR1 = 1, else VAR1 = -1. Short term momentum (VAR2) : The equity market exhibits short term momentum behavior captured here by a 5 days simple moving averages (SMA). If Price > SMA then VAR2 = 1 else VAR2 = -1 Long term momentum (VAR3) : The equity market exhibits long term momentum behavior captured here by a 50 days simple moving averages (LMA). If Price > LMA then VAR3 = 1 else VAR3 = -1 Short term reversal (VAR4) : This is captured by the CRTDR which stands for Close Relative To Daily Range and calculated as following: . If CRTDR > 0.5, then VAR4 = 1 else VAR4 = -1 Autocorrelation regime (VAR5) : The equity market tends to go through periods of negative and positive autocorrelation regimes. If returns autocorrelation over the last 5 days > 0 then VAR5 = 1 else VAR5 = -1.
I put below a tree example with some explanations.
In the tree above, the path to reach node #4 is: VAR3 >=0 (Long Term Momentum >= 0) and VAR4 >= 0 (CRTDR >= 0). The red rectangle indicates this is a DOWN leaf (e. g., terminal node) with a probability of 58% (1 – 0.42). In market terms this means that if Long Term Momentum is Up and CRTDR is > 0.5 then the probability of a positive return next week is 42% based on the in sample sample data. 18% indicates the proportion of the data set that falls into that terminal node (e. g., leaf).
There are many ways to use the above approach, I chose to estimate and combine all possible trees. From the in sample data, I collect all leaves from all possible trees and I gather them into a matrix. This is the “rules matrix” giving the probability of next week beeing UP or DOWN.
I apply the rules in the above matrix to the out of sample data (Jan 2018 – Dec 2018) and I compare the results to the real outcome. The problem with this approach is that a single point (week) can fall into several rules and even belong to UP and DOWN rules simultaneously. Therefore I apply a voting scheme . For a given week I sum up all the rules that apply to that week giving a +1 for an UP rule and -1 for a DOWN rule. If the sum is greater than 0 the week is classified as UP, if the sum is negative it’s a DOWN week and if the sum is equal to 0 there will be no position taken that week (return = 0)
The above methodology is applied to a set of very liquid ETFs. I plot below the out of sample equity curves along with the buy and hold strategy over the same period.
Initial results seem encouraging even if the quality of the outcome varies greatly by instrument. However there is a huge room for improvement. I put below some directions for further analysis.

Comerciante forex on-line Embu das Artes

Search This Blog

R cran forex

Comments

Post a Comment

Popular posts from this blog

Sbv flow trading system

Formulário de candidatura forexworld

Platforma forex