CO\(_2\) Atmosférico em Mauna Loa

Trabalho 1 — Análise de Séries Temporais

Autor

Arthur Pontes Motta

Data de Publicação

6 de junho de 2026

Carregar pacotes

# --- Séries temporais e modelagem ---
library(forecast)    # auto.arima, Arima, forecast, ACF/PACF via ggplot
library(tseries)     # adf.test, kpss.test: testes de raiz unitária
library(TSA)         # eacf (ESACF para identificação de ordens)

# --- Visualização ---
library(ggplot2)     # base gráfica
library(patchwork)   # composição de painéis
library(scales)      # formatação de eixos
library(ggfortify)   # autoplot para objetos ts e decompose

# --- Tabelas ---
library(gt)          # tabelas com formatação avançada
library(broom)       # tidy() para extrair coeficientes de modelos

# --- Manipulação ---
library(tidyverse)   # dplyr, tidyr, stringr, purrr

theme_set(theme_minimal(base_size = 12))

# Paleta de cores consistente
cores <- c("#2E86AB", "#E94F37", "#3BB273", "#F4A261", "#8338EC")

# Função auxiliar: ACF/PACF → data.frame com lag em meses (inteiro)
acf_df <- function(x, lag.max, type = "correlation") {
  obj <- acf(x, lag.max = lag.max, type = type, plot = FALSE)
  tibble(
    lag = as.integer(round(obj$lag * frequency(x))),  # converte anos → meses
    acf = as.numeric(obj$acf)
  ) |>
    filter(lag > 0 | type == "correlation")           # remove lag-0 da PACF
}

pacf_df <- function(x, lag.max) {
  obj <- pacf(x, lag.max = lag.max, plot = FALSE)
  tibble(
    lag = as.integer(round(obj$lag * frequency(x))),
    acf = as.numeric(obj$acf)
  )
}

plot_acf <- function(df, ic, title, ylab = "ACF",
                     vlines = NULL, vlab = NULL) {
  p <- ggplot(df, aes(x = lag, y = acf)) +
    geom_hline(yintercept = 0, color = "gray50") +
    geom_segment(aes(xend = lag, yend = 0), color = cores[1], linewidth = 0.7) +
    geom_hline(yintercept = c(-ic, ic),
               linetype = "dashed", color = cores[2], linewidth = 0.7) +
    labs(title = title, x = "Defasagem (meses)", y = ylab) +
    scale_x_continuous(breaks = seq(0, max(df$lag), by = 6))
  if (!is.null(vlines)) {
    p <- p +
      geom_vline(xintercept = vlines,
                 linetype = "dotted", color = cores[4], linewidth = 0.5)
    if (!is.null(vlab))
      p <- p + annotate("text", x = vlines, y = max(df$acf) * 0.9,
                        label = paste0("lag ", vlines),
                        size = 2.8, color = cores[4])
  }
  p
}

Introdução

O dióxido de carbono (\(\text{CO}_2\)) é o principal gás de efeito estufa de origem antrópica, responsável por aproximadamente dois terços do aquecimento global antropogênico. Sua concentração na atmosfera é monitorada continuamente desde março de 1958 pelo Observatório de Mauna Loa, localizado a 3.397 metros de altitude no vulcão Mauna Loa, na ilha de Havaí. A escolha desse local não foi acidental: a altitude elevada, o isolamento geográfico no meio do Oceano Pacífico e a distância de fontes locais significativas de poluição garantem medições representativas da concentração global de \(\text{CO}_2\) na atmosfera, minimizando influências urbanas, industriais ou de variações locais da vegetação.

As medições iniciadas pelo cientista Charles David Keeling geraram a série histórica mais longa, precisa e cientificamente importante de \(\text{CO}_2\) atmosférico disponível — conhecida mundialmente como Curva de Keeling (Keeling et al., 1976). Esta série documenta de forma inequívoca o aumento contínuo das concentrações de \(\text{CO}_2\) desde o início das medições sistemáticas e constitui evidência fundamental nas discussões sobre mudanças climáticas globais.

Este trabalho analisa a série co2 disponível nativamente no R, que contém as concentrações médias mensais de \(\text{CO}_2\) (em partes por milhão, ppm) de janeiro de 1959 a dezembro de 1997 — 468 observações mensais. A série é amplamente estudada na literatura de séries temporais por reunir, em um único conjunto de dados, dois fenômenos de grande interesse estatístico e científico:

Tendência crescente de longo prazo: reflexo do acúmulo antropogênico de \(\text{CO}_2\) proveniente principalmente da queima de combustíveis fósseis (petróleo, carvão, gás natural) e, em menor escala, de mudanças no uso da terra e desmatamento.
Sazonalidade anual regular: reflexo do ciclo sazonal de fotossíntese e respiração vegetal, predominantemente do hemisfério norte, onde se concentra a maior parte da massa terrestre vegetada do planeta. No inverno boreal (outubro a maio), a respiração das plantas supera a fotossíntese, liberando \(\text{CO}_2\) na atmosfera; no verão boreal (maio a setembro), a fotossíntese intensificada absorve \(\text{CO}_2\), reduzindo sua concentração atmosférica.

Essa combinação de tendência não estacionária e sazonalidade estocástica a torna um caso de referência clássico para a metodologia SARIMA (Seasonal Autoregressive Integrated Moving Average).

Pergunta de interesse: É possível ajustar um modelo SARIMA parcimonioso que capture simultaneamente a tendência e a sazonalidade da série e produza previsões confiáveis para horizontes de até dois anos?

A análise segue rigorosamente a metodologia de Brockwell; Davis (2010) e Morettin; Toloi (2004), e está organizada em quatro etapas: (1) análise descritiva — caracterização da tendência, sazonalidade e componentes da série via decomposição STL; (2) identificação e ajuste — seleção de modelos SARIMA candidatos por critérios de informação (AIC, AICc, BIC) e estimação de parâmetros por máxima verossimilhança; (3) diagnóstico — validação das suposições do modelo via análise de resíduos (autocorrelação, normalidade, homoscedasticidade); e (4) previsão — projeções para 1998-1999 com quantificação rigorosa da incerteza via intervalos de confiança.

Descrição dos Dados e Análise Exploratória