在R中使用我的時間序列的每個月的最后一天-有解無憂

我只需要使用我的資料集中可用的最后一天來稍后聚合，但我沒有成功......

library(tibbletime)
      
dataset <- data.frame(
  timestamp = c("2010-01-01", "2010-01-03", "2010-01-23")
  var =       c( 1,             4,            11)
)

monthly_dataset <- as_tbl_time(dataset, index = timestamp) %>%
                   as_period("1 month")

我如何使用某些函式或 R 包來聚合我的資料集，僅用于使用最后一天可用？

uj5u.com熱心網友回復：

Julian 的回答是一個不錯的開始，但它不會跨越多年，因為分組變數不包含有關年份的資訊。

執行此操作的典型方法是按年月分組，然后過濾到每個年月組的最大日期。

另外，作為 tibbletime 的創建者，我強烈建議您不再使用它。它已被棄用，不再受支持。您應該只使用 clock/lubridate 與 tidyverse 軟體包（如 dplyr）一起進行日期處理，或者如果您真的需要全神貫注于時間序列，則應該使用 tsibble。

library(lubridate)
library(dplyr)

dataset <- tibble(
  timestamp = c(
    "2010-01-01", "2010-01-03", "2010-01-23", 
    "2010-02-01", "2010-02-03", "2011-02-23"
  ),
  var = c(1, 4, 11, 1, 4, 11)
)
dataset <- mutate(dataset, timestamp = ymd(timestamp))

dataset <- dataset %>%
  mutate(
    year_month = floor_date(timestamp, "month"),
    day = day(timestamp)
  )

dataset %>%
  group_by(year_month) %>%
  filter(day == max(day)) %>%
  ungroup()
#> # A tibble: 3 × 4
#>   timestamp    var year_month   day
#>   <date>     <dbl> <date>     <int>
#> 1 2010-01-23    11 2010-01-01    23
#> 2 2010-02-03     4 2010-02-01     3
#> 3 2011-02-23    11 2011-02-01    23

^{由reprex 包于 2022-05-18 創建(v2.0.1)}

uj5u.com熱心網友回復：

一個選項可以是lubridate包，例如

 library(lubridate)
 library(dplyr)
    dataset <- data.frame(
      timestamp = c("2010-01-01", "2010-01-03",
     "2010-01-23", "2010-02-01", "2010-02-03", "2010-02-23"),
      var = c(1, 4, 11, 1, 4, 11)
    )
    
    
    dataset %>%
      mutate(month = timestamp %>% ymd() %>% month()) %>%
      group_by(month) %>%
      slice_tail()

結果：

# A tibble: 2 x 3
# Groups:   month [2]
  timestamp    var month
  <chr>      <dbl> <dbl>
1 2010-01-23    11     1
2 2010-02-23    11     2

轉載請註明出處，本文鏈接：https://www.uj5u.com/qukuanlian/479129.html

標籤：r 日期时间序列总计的微博时间

上一篇：如何在Java6中獲取帶有UTC時間的字串？

下一篇：使用JS將時間戳轉換為“YY/MM/DD”