R语言【CoordinateCleaner】——cc_inst():识别生物多样性机构附近的记录

Package CoordinateCleaner version 2.0-20


Parameters

cc_inst(
  x,
  lon = "decimallongitude",
  lat = "decimallatitude",
  species = "species",
  buffer = 100,
  geod = TRUE,
  ref = NULL,
  verify = FALSE,
  verify_mltpl = 10,
  value = "clean",
  verbose = TRUE
)

参数【x】data.frame。包含地理坐标和物种名称。

参数【lon】:字符串。具有经度坐标的列。默认值 = “decimallongitude”

参数【lat】:字符串。包含纬度坐标的列。默认值 = “decimallatitude”

参数【species】:字符串。具有物种标识的列。仅当 参数【verify】 = TRUE 时才需要。

参数【buffer】:数值。每个机构周围的缓冲区,其中的记录应标记为有问题,以十进制度为单位。默认值 = 100m

参数【geod】:逻辑。如果为 TRUE,则每个首都周围的半径是根据球体计算的,缓冲区以米为单位,与纬度无关。如果为 FALSE,则半径的计算假定为平面坐标,并且随纬度略有变化,在本例中,缓冲区以度为单位。默认值 = TRUE

参数【ref】SpatialPointsDataFrame。提供地理地名录。可以是任何 SpatialPointsDataFrame,但结构必须与机构相同。默认值 = institutions

参数【verify】:    逻辑。如果为 TRUE,则仅当附近没有相同物种的其他记录(缓冲区半径 * 参数【verify_mltpl】)时,才会标记靠近机构的记录。

参数【verify_mltpl】:数值的。指示验证半径超过初始测试半径的因子。默认值 = 10,如果参数【geod】 TRUE,则可能适用,否则可能太大。

参数【value】:字符串。定义输出值。

参数【verbose】:逻辑。如果为 TRUE,则报告测试的名称和标记的记录数。


Detail

注意:缓冲区半径以度为单位,因此不同纬度之间会略有不同。


Value

根据参数【value】,包含测试认为正确的记录的 data.frame“clean”) 或逻辑向量 (“flagged”),其中 TRUE = 测试通过,FALSE = 测试失败/可能有问题。默认值 = “clean”


Conclusion

cc_inst()函数是CoordinateCleaner软件包的主要函数之一,用于执行经纬度坐标的清理和验证操作。以下是对cc_inst()函数的总结性介绍:

  • cc_inst()函数用于检查和清理生物多样性数据集中的经纬度坐标。
  • 该函数可以帮助用户识别和处理数据集中的无效或错误的经纬度坐标。
  • 它还可以根据不同的准则和规则自动修复或删除无效的坐标。
  • cc_inst()函数使用了先进的算法和方法来进行经纬度坐标的验证和清理。
  • 该函数返回一个包含清理后数据集的对象,可以继续在其他函数中使用。

总之,cc_inst()函数是CoordinateCleaner软件包中一个强大的函数,可帮助用户有效地清理和验证生物多样性数据集中的经纬度坐标。


Example

x <- data.frame(species = letters[1:10], 
                decimallongitude = runif(100, -180, 180), 
                decimallatitude = runif(100, -90,90))
             
cc_inst(x, value = "flagged", buffer = 10, geod = FALSE)