我们正在使用 great_expectations 使用 Apache Spark 验证数据。我们无法验证具有 DATE 或 DATETIME 类型的列。
我们使用下面的配置来检查表中的日期条目,如果它们是最近的。
[
{
"expectation_type": "expect_column_min_to_be_between",
"kwargs": {
"column": "started",
"min_value": "2020-12-13"
},
"p_strings_as_datetimes": True
}]
但它抛出错误:not supported between instances of 'str' and 'datetime.datetime'
由于str
失败,我们尝试使用
[
{
"expectation_type": "expect_column_min_to_be_between",
"kwargs": {
"column": "started",
"min_value": datetime.fromisoformat("2020-12-13")
},
"p_strings_as_datetimes": True
}]
但这里我们得到相同的错误:not supported between instances of 'str' and 'datetime.datetime'
我们也尝试了删除后p_strings_as_datetimes
参数,但它仍然抛出相同的错误。
我们也尝试过要求 great_expectations 团队松懈,但他们没有回应。有人知道出了什么问题吗?
这似乎是一个 bug。有一个existing Github Issue open for this,内部团队将正在处理它。我也尝试搜索 Great Expectations Slack,找不到这样的问题,所以对于未来,您可能需要确认您实际上已经在 Slack 的支持频道中发布了该问题。
本站系公益性非盈利分享网址,本文来自用户投稿,不代表边看边学立场,如若转载,请注明出处
评论列表(25条)