Title: | Base de Datos de Facil Acceso del Censo 2017 de Chile (2017 Chilean Census Easy Access Database) |
---|---|
Description: | Provee un acceso conveniente a mas de 17 millones de registros de la base de datos del Censo 2017. Los datos fueron importados desde el DVD oficial del INE usando el Convertidor REDATAM creado por Pablo De Grande. Esta paquete esta documentado intencionalmente en castellano asciificado para que funcione sin problema en diferentes plataformas. (Provides convenient access to more than 17 million records from the Chilean Census 2017 database. The datasets were imported from the official DVD provided by the Chilean National Bureau of Statistics by using the REDATAM converter created by Pablo De Grande and in addition it includes the maps accompanying these datasets.) |
Authors: | Mauricio Vargas [aut, cre] , Juan Correa [ctb], Maria Paula Caldas [rev] (rOpenSci), Frans van Dunné [rev] (rOpenSci), Melina Vidoni [rev] (rOpenSci), Constanza Manriquez [rev] (revision independiente de las vinietas), Instituto Nacional de Estadisticas (INE) [dtc] |
Maintainer: | Mauricio Vargas <[email protected]> |
License: | CC0 |
Version: | 0.6.1 |
Built: | 2024-11-17 05:41:34 UTC |
Source: | https://github.com/ropensci/censo2017 |
Devuelve una conexion a la base de datos local. Esto corresponde a una
conexion a una base DuckDB compatible con DBI. A diferencia de
censo_tabla()
, esta funcion es mas flexible y se puede usar con
dbplyr para leer unicamente lo que se necesita o directamente con DBI para
usar comandos SQL.
censo_conectar(dir = censo_path())
censo_conectar(dir = censo_path())
dir |
La ubicacion de la base de datos en el disco. Por defecto es
|
## Not run: DBI::dbListTables(censo_conectar()) DBI::dbGetQuery( censo_conectar(), 'SELECT * FROM comunas WHERE provincia_ref_id = 1' ) ## End(Not run)
## Not run: DBI::dbListTables(censo_conectar()) DBI::dbGetQuery( censo_conectar(), 'SELECT * FROM comunas WHERE provincia_ref_id = 1' ) ## End(Not run)
Este comando descarga la base de datos completa como un unico archivo zip que se descomprime para crear la base de datos local. Si no quieres descargar la base de datos en tu home, ejecuta usethis::edit_r_environ() para crear la variable de entorno CENSO2017_DIR con la ruta.
censo_descargar(ver = NULL)
censo_descargar(ver = NULL)
ver |
La version a descargar. Por defecto es la ultima version disponible en GitHub. Se pueden ver todas las versiones en https://github.com/pachamaltese/censo2017/releases. |
## Not run: censo_descargar()
## Not run: censo_descargar()
Una funcion auxiliar para desconectarse de la base de datos.
censo_desconectar()
censo_desconectar()
censo_desconectar()
censo_desconectar()
Elimina el directorio censo2017
y todos sus contenidos, incluyendo versiones
de la base de datos del Censo creadas con cualquier version de 'DuckDB'.
censo_eliminar(preguntar = TRUE)
censo_eliminar(preguntar = TRUE)
preguntar |
Si acaso se despliega un menu para confirmar la accion de borrar cualquier base del censo existente. Por defecto es verdadero. |
## Not run: censo_eliminar()
## Not run: censo_eliminar()
Devuelve una tabla completa de la base de datos. Para entregar datos
filtrados previamente se debe usar censo_conectar()
.
censo_tabla(tabla)
censo_tabla(tabla)
tabla |
Una cadena de texto indicando la tabla a extraer |
Un tibble
## Not run: censo_tabla("comunas")
## Not run: censo_tabla("comunas")
Proporciona la cuenta y porcentaje por comuna de las personas de la Region del Bio Bio de acuerdo al maximo nivel educacional que reportan (e.g. primaria, secundaria, universitaria, etc.)
Un tibble con 860 observaciones en las siguientes 4 variables.
comuna
codigo de comuna (15 regiones)
nivel_educ
maximo nivel educacional alcanzado (ver la vinieta con los links a la descripcion de codigos)
cuenta
cantidad de personas censadas en la comuna
proporcion
porcentaje que representan las personas censadas en la comuna
Elaboracion propia con base en datos desagregados del Censo
nivel_educacional_biobio ## Not run: # replicar el resultado usando dplyr directamente con SQL # es ligeramente distinto a las vinietas que explican esta misma tabla nivel_educacional_biobio <- tbl(censo_conectar(), "zonas") %>% mutate( region = substr(as.character(geocodigo), 1, 2), comuna = substr(as.character(geocodigo), 1, 5) ) %>% filter(region == "08") %>% select(comuna, geocodigo, zonaloc_ref_id) %>% inner_join(select(tbl(censo_conectar(), "viviendas"), zonaloc_ref_id, vivienda_ref_id), by = "zonaloc_ref_id") %>% inner_join(select(tbl(censo_conectar(), "hogares"), vivienda_ref_id, hogar_ref_id), by = "vivienda_ref_id") %>% inner_join(select(tbl(censo_conectar(), "personas"), hogar_ref_id, nivel_educ = p15), by = "hogar_ref_id") %>% group_by(comuna, nivel_educ) %>% summarise(cuenta = n()) %>% group_by(comuna) %>% mutate(proporcion = cuenta * (1 / sum(cuenta))) %>% arrange(comuna, nivel_educ) ## End(Not run)
nivel_educacional_biobio ## Not run: # replicar el resultado usando dplyr directamente con SQL # es ligeramente distinto a las vinietas que explican esta misma tabla nivel_educacional_biobio <- tbl(censo_conectar(), "zonas") %>% mutate( region = substr(as.character(geocodigo), 1, 2), comuna = substr(as.character(geocodigo), 1, 5) ) %>% filter(region == "08") %>% select(comuna, geocodigo, zonaloc_ref_id) %>% inner_join(select(tbl(censo_conectar(), "viviendas"), zonaloc_ref_id, vivienda_ref_id), by = "zonaloc_ref_id") %>% inner_join(select(tbl(censo_conectar(), "hogares"), vivienda_ref_id, hogar_ref_id), by = "vivienda_ref_id") %>% inner_join(select(tbl(censo_conectar(), "personas"), hogar_ref_id, nivel_educ = p15), by = "hogar_ref_id") %>% group_by(comuna, nivel_educ) %>% summarise(cuenta = n()) %>% group_by(comuna) %>% mutate(proporcion = cuenta * (1 / sum(cuenta))) %>% arrange(comuna, nivel_educ) ## End(Not run)