Comunidades y competiciones
Foros, conferencias y plataformas para crecer y compararse
Sobre comunidades y competiciones
Esta página agrupa dos tipos de recursos con lógicas muy distintas que conviene no mezclar mentalmente.
Comunidades (foros, conferencias, grupos sectoriales, listas de correo) son el canal natural para resolver dudas, leer cómo otros han enfocado problemas parecidos al tuyo y mantenerte al día sin perseguir activamente novedades. El retorno es lento pero acumulativo: lectores asiduos del RWeekly o de Posit Community internalizan patrones que no aparecen en la documentación. El criterio para participar activamente, y no solo lurkear, es tener algo concreto que aportar (una pregunta bien planteada, una respuesta que tú habrías querido encontrar) o un perfil profesional que quieras hacer visible.
Competiciones funcionan al revés: ciclo corto, feedback numérico inmediato y un leaderboard que ordena de forma despiadada. Son la mejor forma de calibrar tu nivel real frente al estado del arte en un problema acotado y de aprender técnicas que rara vez se ven en proyectos reales (stacking, feature engineering agresivo, pseudo-labeling). Su trampa es que la habilidad que entrenan no es exactamente la del trabajo aplicado: en una competición todos los datos están limpios, el target está definido y existe ground truth. En la práctica profesional, la mitad del esfuerzo es construir ese marco. Úsalas como gimnasio, no como sustituto del trabajo real.
Dentro de competiciones conviene distinguir tres familias:
- Generalistas (Kaggle): catálogo enorme, comunidad masiva, formato estandarizado. El sitio para empezar y para problemas tabulares o de visión por computador con datos públicos.
- Especializadas en alto impacto (DrivenData, DREAM Challenges): problemas reales planteados por ONGs, agencias o consorcios biomédicos. Menos competidores, premios menores o nulos, pero el problema importa.
- Académicas / benchmark (OpenML, CodaLab, NeurIPS Datasets & Benchmarks): orientadas a publicar y comparar métodos reproducibles más que a ganar premios. Imprescindibles si publicas papers de ML.
El orden de esta página refleja una jerarquía pragmática: primero comunidades técnicas del ecosistema R y ciencias de la vida, luego publicaciones recurrentes, después conferencias, y al final las plataformas de competiciones de menos a más especializado.
Posit Community (antes RStudio Community)
Foro oficial de Posit (la empresa antes conocida como RStudio), heredero del antiguo RStudio Community. Es el punto de encuentro principal para preguntas sobre tidyverse, RStudio IDE, Quarto, Shiny, Posit Connect y herramientas adyacentes. Moderado por personal de Posit y por usuarios veteranos.
Para quién
- Cualquier usuario serio de R que use
tidyverse, RStudio/Positron o Quarto. La mayoría de los maintainers principales (Hadley Wickham, Jenny Bryan, Mine Çetinkaya-Rundel, Garrick Aden-Buie) participan o pasan por allí con regularidad. - Usuarios de Shiny, Stack Overflow ha quedado relativamente pobre para Shiny, mientras que aquí hay un canal específico bien mantenido.
- Quien necesita feedback sobre un reprex (
reprex::reprex()) bien construido: el foro lo espera y lo premia con respuestas rápidas.
Valor diferencial
Frente a Stack Overflow, el ritmo es más conversacional y se admiten preguntas de criterio (“¿cuál es la forma idiomática de hacer X?”) que en SO se cerrarían como opinion-based. Frente a Reddit (r/Rlanguage, r/rstats), la señal/ruido es mucho mejor y las respuestas vienen de gente identificable y con histórico técnico verificable.
Enlaces
- Posit Community
- Guía para hacer un buen reprex
r/rstats, alternativa más informal en Reddit
Relacionadas en esta página
RWeekly, para mantenerse al día sin estar pendiente del foro.useR! / posit::conf, la versión presencial de la misma comunidad.
R-Ladies
Red global de meetups para promover la diversidad de género en la comunidad R. Más de 200 capítulos activos en todo el mundo, con presencia consolidada en Madrid, Barcelona, Valencia y otras ciudades españolas. Organiza charlas, talleres y mentoring. Coordinado por una leadership team internacional y financiado por Posit, NumFOCUS y otros patrocinadores.
Para quién
- Mujeres, personas no binarias y minorías de género en R, en cualquier nivel, desde principiantes hasta maintainers de paquetes.
- Aliados que quieran apoyar la diversidad de la comunidad asistiendo a charlas abiertas (la mayoría de eventos son mixtos. Solo algunos formatos de mentoring y networking son exclusivos del público objetivo).
- Quien busque conferenciantes o panelistas para diversificar un evento técnico: el directorio público es la mejor fuente.
Valor diferencial
Más allá del componente social, los meetups de R-Ladies suelen ser técnicamente sólidos y bien grabados. El canal de YouTube acumula cientos de charlas sobre temas concretos (paquetes, técnicas, casos de estudio) impartidas en formato accesible. El directorio público de ponentes es además el recurso más visible para encontrar talento experto en R fuera de los círculos angloparlantes.
Enlaces
- R-Ladies Global
- R-Ladies Madrid, capítulo activo con eventos regulares
- Directorio de ponentes
- Canal de YouTube
Relacionadas en esta página
useR! / posit::conf, R-Ladies organiza tradicionalmente una sesión satélite.
rOpenSci
Iniciativa sin ánimo de lucro que promueve el uso de R en ciencia abierta. Mantiene un sistema de peer review de paquetes R orientados a investigación, organiza el community call mensual y publica guías sobre desarrollo de paquetes científicos. Financiado por la NSF, Sloan Foundation y la propia comunidad.
Para quién
- Desarrolladores de paquetes R con propósito científico, especialmente si tu paquete consume APIs de datos abiertos (gubernamentales, ecológicos, climáticos) o implementa métodos publicados.
- Investigadores que quieren publicar un paquete con sello de calidad reconocido: el peer review de rOpenSci es probablemente el estándar más alto fuera del propio CRAN/Bioconductor.
- Quien busca paquetes para acceder a datos abiertos: el ecosistema rOpenSci cubre desde
rnaturalearth(cartografía) hastataxize(taxonomía),osmdata(OpenStreetMap),rgbif(biodiversidad), entre muchos otros.
Valor diferencial
El sistema de revisión por pares es único en el ecosistema R: dos revisores asignados, editor, criterios explícitos sobre documentación, tests y diseño. Pasar la revisión es un sello de calidad real (no decorativo) y aporta visibilidad al paquete dentro de la comunidad académica. La guía de desarrollo (rOpenSci Packages: Development, Maintenance, and Peer Review) es además uno de los mejores libros sobre cómo construir un paquete R serio.
Enlaces
Relacionadas en esta página
Bioconductor Slack, equivalente en el dominio biomédico para discutir desarrollo y métodos.
Bioconductor Slack
Workspace de Slack oficial del proyecto Bioconductor. Canal de comunicación primario entre maintainers de paquetes, core team y usuarios avanzados. Acceso por invitación abierta (formulario público).
Para quién
- Usuarios serios de Bioconductor con preguntas que exceden el alcance de las vignettes y de la lista de correo
bioc-devel/bioc-help. - Desarrolladores de paquetes Bioconductor o aspirantes a serlo: aquí se ven discusiones de diseño en curso, anuncios de release, cambios planeados en clases base.
- Investigadores de bioinformática que quieren establecer contacto con los maintainers de paquetes que usan en su trabajo, la mayoría son accesibles y responden con buena disposición.
Valor diferencial
Frente a la lista de correo histórica (bioc-help@stat.ethz.ch), Slack permite conversaciones más fluidas y canales temáticos (single-cell, microbioma, proteómica, etc.). Frente a GitHub Issues de paquetes concretos, es el lugar adecuado para preguntas de método (“¿qué paquete usaría para X?”) que no encajan como bug ni como feature request.
Enlaces
- Bioconductor
- Invitación al Slack
- Listas de correo
bioc-helpybioc-devel, alternativa asíncrona, históricamente activa
Relacionadas en esta página
rOpenSci, equivalente en el dominio de ciencia abierta general.DREAM Challenges, competiciones biomédicas que muchas veces se discuten primero aquí.
RWeekly
Boletín semanal comunitario de novedades del ecosistema R, mantenido por un equipo rotatorio de editores. Cada lunes aparece una recopilación de blog posts, paquetes nuevos, releases, conferencias y recursos publicados durante la semana anterior. Llega por web, RSS o newsletter.
Para quién
- Usuarios de R que quieran mantenerse al día sin estar continuamente revisando Twitter/X, Mastodon, Bluesky o feeds individuales.
- Maintainers de paquetes que quieran que su release aparezca en una vitrina con audiencia internacional (basta con abrir un PR contra el repo de GitHub).
- Formadores y docentes: cada número es una mina de ejemplos recientes para clase.
Valor diferencial
Es el único agregador con curación humana sostenida del ecosistema R. Lo que sale en RWeekly suele importar. Lo que no sale, raramente importa para el grueso de la comunidad. Frente a buscar manualmente en feeds RSS, ahorra horas. Frente a Twitter/X (cuya cobertura del ecosistema R se ha degradado bastante), es más estable y menos ruidoso.
Enlaces
- RWeekly
- Repositorio en GitHub, para proponer entradas
- Podcast RWeekly, versión audio comentada por Eric Nantz y colaboradores
Relacionadas en esta página
Posit Community, para profundizar en cualquier tema que aparezca en el boletín.
useR! y posit::conf
useR! es la conferencia internacional histórica de la comunidad R, organizada anualmente por la R Foundation y voluntarios locales desde 2004. Carácter académico, multidisciplinar, con sede rotatoria.
posit::conf (antes RStudio::conf) es la conferencia anual de Posit, más orientada a producto y workflow profesional. Centrada en EE. UU. pero con presencia internacional creciente. Materiales (slides, vídeos) publicados de forma sistemática.
Para quién
- useR!: investigadores y desarrolladores serios de R, especialmente quienes mantienen paquetes o publican métodos. El nivel técnico es alto y la comunidad presente es la core del proyecto R.
- posit::conf: profesionales aplicados que trabajan con
tidyverse, Quarto, Shiny, Posit Connect en empresa o investigación aplicada. Más práctica, más enfocada en workflows. - Ambas: oportunidad de poner cara a maintainers cuyos paquetes usas a diario, y de presentar trabajo propio en formato
lightning talko póster (barrera de entrada baja, sobre todo para useR!).
Valor diferencial
Tras la pandemia, una proporción importante de charlas se publica en YouTube poco después. Ver los vídeos del último año de useR! y de posit::conf es probablemente la forma más rentable de mapear qué se está moviendo en el ecosistema R sin viajar. Las keynotes y las charlas de mantenedores reconocidos (Wickham, Bryan, Çetinkaya-Rundel, Pedersen, entre otros) son material formativo de primera categoría.
Enlaces
- useR! Conference, la sede y fechas varían cada año
- posit::conf
- Charlas históricas de useR! en YouTube
- Charlas históricas de posit::conf en YouTube
Relacionadas en esta página
R-Ladies, organiza típicamente eventos satélite.Posit Community, discusión asíncrona durante el resto del año.
Kaggle
Plataforma de competiciones de ciencia de datos más conocida del mundo, propiedad de Google desde 2017. Aloja competiciones (con o sin premio), un repositorio masivo de datasets públicos, notebooks compartidos, Kaggle Learn (cursos cortos gratuitos) y Kaggle Models (catálogo de modelos preentrenados).
Para quién
- Profesionales o estudiantes de ML que quieran calibrar nivel real frente a un leaderboard internacional.
- Quien necesita datasets públicos limpios y bien documentados para un proyecto propio o para enseñar, el catálogo es probablemente el más grande accesible sin fricción.
- Quien quiera aprender técnicas de competición (boosting, stacking, feature engineering avanzado, pseudo-labeling) leyendo write-ups de los ganadores: prácticamente todas las competiciones publicadas tienen análisis post-mortem detallados.
Valor diferencial
Es el único sitio donde se puede ver lo que hace la gente del top mundial en problemas concretos. Los notebooks upvoted de competiciones recientes valen más que muchos cursos. Frente a alternativas:
- Más usuarios, más diversidad de problemas, mejor tooling (notebooks integrados con GPU/TPU gratuitos en niveles básicos).
- Pero también más ruido: los foros de cada competición acumulan dudas básicas y spam. Filtra por highest upvoted y por Grandmaster badges.
Aviso importante: ganar Kaggle no equivale a ser un buen científico de datos aplicado. La distribución de habilidades entrenada es asimétrica (mucho modeling, poco problem framing).
Enlaces
- Kaggle
- Kaggle Learn, cursos cortos gratuitos
- Kaggle Datasets
- Concurso de Storytelling Posit con Quarto, competición fuera de Kaggle, pero del mismo género
Relacionadas en esta página
DrivenData, alternativa con problemas de mayor impacto social.OpenML, alternativa orientada a ML reproducible y benchmarking académico.
DrivenData
Plataforma de competiciones de ciencia de datos enfocada en problemas sociales y de impacto real: salud pública, conservación, equidad, cambio climático, infraestructura. Cofundada por exalumnos de Harvard en 2014. Los datasets suelen venir de ONGs, agencias gubernamentales o instituciones de investigación.
Para quién
- Científicos de datos que quieran trabajar en problemas con peso real más allá de la pura optimización de métricas.
- Profesionales junior o intermedios buscando un portfolio con narrativa: una competición de DrivenData bien resuelta cuenta una historia más memorable en una entrevista que una de Kaggle sobre precios de viviendas.
- ONGs e instituciones interesadas en lanzar una competición, DrivenData es la plataforma de referencia para este caso de uso.
Valor diferencial
Menor competencia (típicamente cientos en lugar de miles de equipos), lo que hace el top-10 alcanzable para participantes serios pero no superélite. Los problemas son intrínsecamente más interesantes (datasets reales, etiquetado imperfecto, métricas alineadas con utilidad práctica) y el write-up de los ganadores suele tener valor metodológico sustancial. No esperes premios económicos comparables a Kaggle, el incentivo es otro.
Enlaces
- DrivenData
- Blog de DrivenData, análisis técnicos de competiciones pasadas
Relacionadas en esta página
Kaggle, alternativa generalista, mayor escala, problemas más estandarizados.DREAM Challenges, equivalente especializado en biomedicina.
DREAM Challenges
Iniciativa académica que organiza competiciones de modelado predictivo en biomedicina y biología de sistemas desde 2006, ahora alojadas en la plataforma Sage Bionetworks (Synapse). Cada challenge es un consorcio internacional con datos reales (multi-ómicos, clínicos, de imagen médica), comité organizador científico y publicación conjunta de los resultados en revistas como Nature Methods, Nature Biotechnology o Cell Systems.
Para quién
- Investigadores en bioinformática, biología computacional, ML aplicado a salud, que quieran publicar y comparar métodos en un marco riguroso.
- Estudiantes de doctorado y postdocs buscando datos limpios, benchmarks establecidos y oportunidad de coautoría en publicaciones de alto impacto.
- Empresas farmacéuticas y diagnósticas: muchos challenges tienen patrocinio industrial y son una forma de mapear talento.
Valor diferencial
A diferencia de Kaggle, los DREAM Challenges están diseñados para producir conocimiento publicable, no solo leaderboards. El protocolo suele incluir holdouts cegados (los participantes no ven el test set hasta el final), publicación conjunta de todos los métodos top y comparación sistemática frente a baselines establecidos. Es probablemente el formato más cercano a ciencia rigurosa en el mundo de las competiciones de ML.
Enlaces
- DREAM Challenges
- Sage Bionetworks / Synapse, plataforma donde se alojan
- Archivo de challenges pasados, incluye datasets y resultados publicados
Relacionadas en esta página
Bioconductor Slack, espacio natural para discutir estos challenges en español/inglés.DrivenData, competiciones de impacto pero fuera del dominio biomédico.
OpenML
Plataforma open-source para machine learning reproducible mantenida desde la Universidad de Eindhoven. Combina un repositorio masivo de datasets etiquetados con APIs (Python, R, Java) que permiten descargar y comparar experimentos de forma sistemática. Hospeda también competiciones tipo benchmark.
Para quién
- Investigadores en ML que necesitan benchmarks reproducibles para evaluar un método nuevo. Cada dataset tiene historial de resultados previos sobre el mismo split → comparable de verdad.
- Educadores: la API
OpenMLpara Python/R permite descargar datasets canónicos con una línea de código, mucho más cómodo quesklearn.datasetso subir CSVs manualmente. - Quien diseña un automated machine learning (AutoML): OpenML es el repositorio de tareas más usado para benchmarking de sistemas AutoML.
Valor diferencial
Frente a Kaggle, prioriza reproducibilidad sobre competición: los splits están fijados, los resultados publicables, el énfasis en benchmark limpio. Frente a UCI Machine Learning Repository (más antiguo), tiene infraestructura moderna (APIs, versionado de datasets, metadatos estructurados). Es la opción correcta cuando lo que quieres es escribir un paper de ML y necesitas justificar la elección de datasets.
Enlaces
- OpenML
- Paquete R
OpenML - Paquete Python
openml - CodaLab Competitions, alternativa académica con más foco en challenges puntuales
- NeurIPS Datasets & Benchmarks Track, track específico de NeurIPS sobre datasets
Relacionadas en esta página
Kaggle, alternativa generalista, foco en competición más que en benchmark.DREAM Challenges, equivalente especializado en biomedicina con publicación científica.