Aprenda a usar o SAS

Aprenda a usar o SAS

Atualizado em 15 de agosto de 2011.

Conteúdo


Introdução

O SAS é o pacote estatístico mais utilizado pelas grandes corporações, em mais de 100 diferentes países, com cerca de 40.000 licenças distribuídas e quase 4 milhões de usuários. O nome nasceu como um acrônimo: Statistical Analysis System (SAS), mas a quantidade de serviços e produtos oferecidos pela SAS (a companhia que produz o SAS) foi se tornando tão diversa que hoje em dia o nome é simplesmente SAS.

As origens do software datam da década de 70, quando os computadores ainda eram operados por cartões perfurados (o comando CARDS, dentro do passo DATA, vem justamente daí) e o poder de processamento era muito baixo. O software é composto por diversos módulos, que provem soluções para problemas específicos. Os principais módulos são:

  • SAS/Base: é o sistema básico do SAS, necessário para rodar qualquer outro produto SAS. Ele contém o passo DATA, para manipulação de dados e alguns procedimentos estatísticos simples.
  • SAS/STAT: é o módulo que provê uma grande quantidade de métodos estatísticos, como regressão, ANOVA, análise multivariada, análise de sobrevivência entre outros.
  • SAS/GRAPH: é o módulo que permite fazer gráficos em alta resolução.
  • SAS/ETS: é o módulo que permite fazer análise de séries temporais.
  • SAS/EG (ou Enterprise Guide): é uma interface gráfica para o SAS, permitindo fazer algumas análises estatísticas apontando e clicando.

Ao comprar uma licença do programa, é necessário pagar uma taxa adicional por cada módulo, e em geral um consultor de vendas da SAS vai oferecer orientação para qual módulo comprar e quanto você vai pagar.


Primeiros passos


Como obter uma cópia

O SAS é um software que é provido na base de licenciamento. Anualmente a sua empresa paga uma taxa (que pode ir de alguns milhares até milhões de dólares) para poder rodar o programa. Versões novas são incluídas nessa taxa de licenciamento anual. Entre em contato com o representante SAS mais próximo para obter informações de licença para o seu caso específico.

Também é possível obter uma versão limitada do SAS, que só lê até 1500 observações de cada conjunto de dados, por um preço mais razoável. Ela se chama SAS Learning Edition, e custa oficialmente 199 dólares.

SAS Learning Edition

Alternativamente, se você estuda em uma Universidade pública, é possível que você tenha aceso a licenças do SAS. Em particular, se você estuda na USP, você tem direito a licenças do SAS para uso acadêmico. Basta preencher o formulário disponível na página do Centro de Computação Eletrônica e enviá-lo por fax para o CCE. Em alguns dias você receberá um e-mail com a sua licença e instruções para instalação.

Update

Atualização em 15/08/2011: desde que escrevi esse post originalmente algumas coisas mudaram em relação às formas de licenciamento acadêmico do SAS. Hoje em dia não é mais comercializada a versão de estudante, e assim o estudante prospectivo que quiser aprender sem gastar uma fortuna em licença de software ficou com suas opções bem mais restritas.

Em contra-partida, uma boa notícia é que a SAS não detém mais o monopólio sobre a linguagem de programação SAS, e já há pelo menos uma outra alternativa comercial, com preços bem melhores. Estou falando do WPS (World Programming System). Veja também o seguinte post a respeito: World Programming System: An Alternative to SAS. Se você tem interesse em aprender a linguagem mas sem gastar os rios de dinheiro para comprar uma licença SAS, pode valer a pena contatá-los. Eu enviei uma sugestão para eles montarem uma versão de estudante (WPS Student Edition, quem sabe), justamente para poder indicar para quem está aprendendo a linguagem.

Para aqueles mais aventurosos, há ainda uma outra opção: o DAP – The Dap Project for Statistics and Graphics, uma espécie de GNU SAS. O conjunto de comandos suportados é bem menor que no WPS (veja Open Source Compiler for SAS language/ GNU -DAP), e você terá que compilar o programa na unha (./configure, make, etc) além de não contar com uma interface gráfica ou modo interativo de uso (a não ser que você tenha familiaridade com o EMACS). Em contra-partida o DAP é completamente gratuito. Daria também um excelente projeto de curso para alguém na interface entre estatística e ciência da computação, trabalhar melhorando o DAP ou construindo uma interface gráfica.


Começando a mexer

Assim que você tiver uma cópia do SAS para começar a trabalhar, uma apostila muito boa para dar os primeiros passos é a disponibilizada no website do Kazuaki Uekawa: Kaz SAS Manuals. Ela cobre desde o comecinho (como abrir o SAS) até gerenciamento de saídas usando o Output Delivery System (ODS).

Apostilas alternativas são: How to use SAS, da UCLA e Exploring the Baseball data with SAS and SAS/INSIGHT, da York University. Um bom material em português pode ser obtido aqui: Treinamento de SAS – CENAPAD-SP.


Material introdutório

A melhor introdução ao SAS disponível é o livro The Little SAS Book, de Lora D. Delwiche e Susan J. Slaughter. Ele é amplamente recomendado por diversas fontes como um excelente manual de introdução ao SAS, e sua grande vantagem é seu pequeno tamanho e a quantidade de conteúdo que ele consegue cobrir. A maioria dos manuais on-line do SAS tem milhares de páginas (só o manual do SAS/STAT tem quase 6000 páginas). Para alguém que está querendo começar a mexer com a linguagem, tamanha quantidade de informação atrapalha. O Little SAS Book tem apenas 329 páginas, e cobre desde a introdução bem básica ao sistema, até a programação usando MACROS, passando por vários pontos importantes, como gerenciamento de saídas com o ODS, e geração de relatórios com o PROC REPORT. Há também apêndices, que explicam, entre outras coisas, como aprender o SAS sendo um usuário de SPSS, como aprender o SAS sendo usuário de outras linguagens de programação e do SQL. O livro ainda tem vários pontos úteis mesmo para usuários avançados, como práticas de programação e de debug. Se você considera aprender SAS a sério, você deve considerar comprar esse livro.

Little SAS Book


Cursos de SAS

Existem algumas empresas que oferecem treinamento de SAS no Brasil, além é claro dos próprios treinamentos oficiais da SAS, os quais você encontra aqui. Dentre as outras empresas, posso recomendar por exemplo a BrainWorks, que é uma das melhores no mercado nacional em SAS.

No próprio site do SAS, existem alguns materiais e treinamentos online gratuitos em SAS. Antigamente era necessário um cadastro para ter acesso à este material, mas hoje em dia está disponível diretamente: SAS Training Online (Free).


Aprofundando os conhecimentos

Há varias fontes para aperfeiçoar seus conhecimentos de SAS. De livros, passando por sites da web e manuais. Um bom livro para seguir na parte estatística é Handbook of Statistical Analyses Using SAS.

Handbook of Statistical Analyses Using SAS

Os manuais para o SAS estão disponíveis no site da empresa, para qualquer pessoa, veja Documentation for SAS 9 Products. Eles são também uma excelente fonte para estudar a linguagem e tirar dúvidas sobre argumentos de procedimentos.

Um site com referências mais avançadas é SAS Coding Tips.


Obtendo ajuda


Listas de discussão

Listas de discussão são uma fonte muito boa de ajuda em várias áreas do conhecimento. Duas listas que você pode utilizar para procurar ajuda ou trocar conhecimentos sobre o SAS são:

  • SAS-L: com duas décadas de idade, é a maior comunidade on-line para discussão da linguagem. O idioma oficial é o inglês, e conta com contribuições diárias de profissionais de diversas áreas, com um volume de tráfico de aproximadamente 2000 mensagens por mês. Para se inscrever, visite o site da Virgínia State University: http://www.listserv.uga.edu/archives/sas-l.html.
  • SAS Brasil: lista brasileira para discussão SAS e estatística computacional. A idéia da lista é unificar a comunidade brasileira de programadores SAS, divulgando tutoriais, guias bibliográficos, livros, apostilas, como fazer certas coisas no SAS, informações sobre conferências e ajudar iniciantes. Para se cadastrar, visite a página do grupo: Yahoo Grupos: SASBrasil.


Suporte oficial

Todo usuário de uma cópia licenciada do SAS tem direito a contar com o suporte on-line do SAS, feito através do e-mail: supportarrobasas.com . Qualquer problema que você tiver, você pode escrever para esse e-mail, lembrando de colocar no início da mensagem, a sua informação de licença do SAS. Isso aparece na janela de log assim que você liga o SAS/Base.

NOTE: Copyright (c) 1999-2005 by SAS Institute Inc., Cary, NC, USA.
NOTE: SAS (r) Proprietary Software Release 9.3 (TS2M0)
Licensed to Bananas Corporate, Site XXXXX.
NOTE: This session is executing on the WIN_XP platform.

Observação: usuários do SAS Learning Edition não tem direito ao suporte on-line.


tabs-top

31 Comentários para “Aprenda a usar o SAS”

  1. Jovelina Maria disse:

    Muito bom o comentário. Preciso saber onde encontrar cursos SAS grátis e o pacote também, estou desempregada e preciso aprender tudo sobre banco de dados e SAS.

    • Edmond disse:

      amiga, infelizmente não é assim que funciona….
      “procurar aprender banco de dados e sas….”;
      vc tem que no minimo gostar disso, senao nunca vai valer a pena…mesmo vc estando empregada…
      Boa sorte.

  2. Rossanna disse:

    Alguém tem o passo a passo como entrar com os dados para fazer uma análise multivariada-ACP no SAS?

  3. Uriellla disse:

    Existem cursos gratuitos sobre programação SAS?

  4. Priscila disse:

    Trabalho em um banco e agora precisamos fazer o curso de SAS, porém o banco não indicou lugares em Brasilia, tenho feito pesquisas mas não localizei empresas que oferecem esse curso.

  5. Gabriel disse:

    Seu site é genial.
    Acesso frequentemente, e cada vez aprendo algo novo.
    Parabéns pela iniciativa, certamente se trata de um
    valioso conteudo estatistico na web!

  6. juliana dias disse:

    Fernando

    Boa tarde.
    Estou com um problema, que talvez você possa ajudar.
    Estou precisando criar duas variáveis em um banco de dados no SAS,
    referentes ao primeiro (y_1) e ao ultimo valor (y_n) de uma sequencia
    pertecente a cada animal e em sua respectiva idade e unidade de
    produção, conforme exemplo abaixo:

    Unidade Animal Idade x y
    y_1 y_n
    503 3555 34 23 27.40
    27.40 15.60
    503 3555 34 55 30.60
    503 3555 34 116 28.80
    503 3555 34 146 28.20
    503 3555 34 175 26.40
    503 3555 34 203 21.80
    503 3555 34 242 21.00
    503 3555 34 272 17.60
    503 3555 34 299 15.60

    Gostaria que esses valores se repetissem ao longo da coluna pesagem
    para depois facilitar uns cálculos de produção e etc.
    Tentei programar com First e Last, mas não estou conseguindo fazer.
    Se for porssível, aguardo retorno e desde já agradeço a sua atenção

    Julia

    • Julia,

      Estou sem uma instalação SAS para poder testar se vai funcionar (e o DAP parece não suportar First e Last), mas o código abaixo parece ser o que você quer:

      /* Prob Animal, Juliana Dias
      */

      data animal;
      infile “animal.dat” firstobs=1;
      input unidade animal idade x y;

      proc sort data=animal;
      by unidade animal idade;

      data result;
      set animal;
      retain y1 yn 0;
      by unidade animal idade;
      if First.idade then y1=y;
      if Last.idade then do;
      yn = y;
      output;
      end;
      drop x y;
      end;

  7. William Mello disse:

    Sei que já foi criado há um bom tempo, mas caso consiga responder, poderia me indicar uma boa forma de iniciar minha carreira como Analista Programador SAS?
    Sou analista desenvolvedor de sistemas Web e banco de dados Oracle, mas estou no inicio da minha carreira, e Analise de dados e obtenção de informações relevantes através de dados tem me chamado bastante a atenção.
    Você saberia me dizer a melhor para iniciar com SAS?
    Muito Obrigado!

    • Boa noite William,

      A melhor forma seria conseguir estagiar ou trabalhar em algum projeto que envolva SAS no seu trabalho. Caso não seja possível, sugeriria as referências que eu recomendo acima, principalmente os próprios manuais do SAS, que já que você já é programador vão ser de extrema utilidade. Recomendo particularmente o SAS® 9.1.3 Language Reference: Concepts, o Language Reference: Dictionary e o Step-by-Step Programming with Base SAS Software. Todos estão disponíveis gratuitamente na página do SAS.

      Fernando,

  8. marina disse:

    Oi!
    Sou aluna da UFMG, gostaria de saber como adquiro uma licensa do SAS.
    OBRIGADA

  9. Karina disse:

    Oi!

    Gostaria de saber como faço para adquirir o SAS e o valor anual da licença para uma empresa.

    Karina

  10. Marcos disse:

    Ola Fernando

    Gostaria de saber sua opinião sobre o SAS.
    Qual o potencial de mercado dele? ele é bem aceito?
    É uma boa área para se fazer carreira?
    Com o que podemos comparar a remuneração do profissional SAS?
    Estou querendo entrar na area, mas antes ouvir opiniões sobre profissionais mais experientes

    Obrigado e um abraço

    • Oi Marcos,

      Ele é bem aceito principalmente em empresas de grande porte, e em alguns setores e indústrias tem uma penetração muito grande, como retail banking e data mining. A remuneração seria parecida com a de profissionais de Data Mining/Warehousing e outros profissionais na área de banco de dados. É uma área interessante de se atuar sim, mas eu manteria um pé em Mining/Warehousing também. Conhecimentos nessa área complementam muito bem os desafios rotineiros de quem trabalha com SAS.

      Fernando,

  11. Vladimir disse:

    Ola,
    Gostaria de perguntar se há algum editor com compilador para o SAS e também se é possível fazer apenas o syntax check sem ter o SAS instalado na máquina.

    Grato,
    Vladimir

    • Editor com compilador? O mais próximo seria o SAS Enterprise Guide, ou o WPS Workbench, mas você teria que comprar ambos. Em ambos os casos você teria que ter o SAS instalado na máquina. É difícil se basead no Syntax Check somente porque o SAS acaba aceitando vários comandos malformados e corrige ele pra você, então mesmo algo mal formado às vezes acaba rodando…

  12. maria disse:

    A interpretação da regressão logistica realizada pelo programa SAS é igual ao do STATA ou seja, coeficiente negativo significa proteção e positivo risco?

  13. Edmar disse:

    Alguém tem uma apostila sobre WPS estou com muita dúvida neste software.

  14. Msc. Diego disse:

    Olha só, estou precisando de uma rotina no sas para fazer o seguinte: tenho uma coluna de 1 a 210000, desta coluna quero apenas aqueles números que forem múltiplos de 2 (2 4 6 8 10 12), ou 10 (10 20 30 40 50), tem como eu fazer isso?

  15. Lívia disse:

    Olá! Gostaria de saber como calculo integrais no SAS. Mais especificamente, preciso escrever um comando que calcule o dilogarítmo para poder chamá-lo depois em outro comando que calculará minha priori.

    Desde já agradeço.

    Lívia

  16. Natalia disse:

    Olá, gostaria de saber se o SAS calcula determinante de matriz alfanumérica, ou seja, se ele monta a equação resultante do determinante. Se sim, como faço isto??
    Obrigada!!!!!

  17. Marcella disse:

    Por gentileza, alguém sabe como inserir percentual utilizando o SAS Enterprise Guide – Sumary Tables?

Deixar uma resposta