[글쓴이:] euriion

Posted in 미분류

LLM은 스스로 사고할 수 있는가?

LLM이 스스로 사고를 하는지에 대한 것은 이제 더 이상하지 않는 조금 지난 주제입니다. 아직까지 그런 생각을 하는…

Posted in 미분류

R에서 T-test, 카이제곱으로 가설검정 결과 간단하게 확인하기

R언어에서 T-test와 Chi-square 검정을 하는 간단한 스니펫입니다.간단한 것이지만 자주 쓰지 않으면 너무 기본이라서 오히려 기억이 잘 나지…

Posted in 미분류

MS의 무료 생성형 AI 강좌

Microsoft가 제공하는 무료강좌입니다. Github에 있습니다. 아직 다 보진 않았습니다.보게 되면 간단한 리뷰를 나중에 업데이트하겠습니다. https://microsoft.github.io/generative-ai-for-beginners/?fbclid=IwAR035hTm3dqqUzSeH1bjlPbeOtzVrRK1SEADWFH8i224fnydTD_X4UE4EYI#/

Posted in 미분류

GPTs 유명 앱의 프롬프트 목록

GPTs 앱의 유출된 프롬프트가 있는 깃헙 레파지토리입니다. https://github.com/friuns2/Leaked-GPTs

Posted in 미분류

배우기 쉬운 LLM 강좌

Github에 공개된 좋은 LLM 강좌를 소개합니다. 아래의 링크에 가시면 꽤 많은 것들이 있습니다. https://github.com/mlabonne/llm-course

Posted in 미분류

Azure OpenAI GPT4-Turbo 지원 리전

2023년 11월 17일부로 Azure Openai에서 GPT4-Turbo를 지원하는 리전 목록입니다. GPT-4 Turbo 모델을 Azure에서 사용하기 위해서 계속 기다렸지만…

Posted in 미분류

R로 베타 분포 그래프그리기 – Plotting Beta Distribution

베타분포는 시행에 따른 성공결과에 대한 분포로 베이지안의 기본이 되며 여러가지로 사용이 많이 되는 분포입니다. 강화학습이나 Multi Armed…

Posted in 미분류

You tried to access openai.ChatCompletion, but this is no longer supported in openai>=1.0.0

openai 1.0.0 이상의 버전에서는 openai.ChatCompletion으로 completion을 생성할 수 없고 먼저 client를 생성한 후 client에서 completion을 받도록 변경되었습니다….

Posted in 미분류

Pyperclip could not find a copy/paste mechanism for your system.

Pyperclip을 사용할 때 에러가 발생할 수 있다.Pyperclip could not find a copy/paste mechanism for your system.다음과 같이…

Posted in 미분류

GPT assistant file의 업로드 오류 메세지

OpenAI GPT API로 assistant file을 업로드하다 오류가 발생하면 아래와 같이 매우 장황한 설명을 합니다. 오류의 대부분은 다음과…

Posted in 미분류

우분투에 포스트그레스 설치 – Install PostgreSQL on Ubuntu Linux

아래의 순서로 하면됩니다. 자세한 내용은 아래 원문을 참고하세요. https://www.postgresql.org/download/linux/ubuntu/

Posted in 미분류

Rstudio server에서 Copilot 사용하기

Rstudio 2023년 9월 28일 릴리즈 버전 이후부터는 Github copilot을 정식지원합니다. neovim의 plugin을 이용해서 연동한 것인데 깔끔하게 잘…

Posted in 미분류

command ‘x86_64-linux-gnu-gcc’ failed with exit status 1

WSL이나 Linux를 새로 설치한 후에 Python 패키지를 설치할 때 저런 에러가 내면 패키지를 빌드하는데 필요한 패키지가 설치…

Posted in 미분류

Azure OpenAI GPT API 의 민감정보 필터링 정보

GPT API중 completion 결과 중에 hate, self_harm, sexual, violence 이 4가지에 대한 민검정보 필터링에 대환 결과 여부와…

Posted in 미분류

한국어 형태소 분석기 – Bareun 바른

새로운 한국어 형태소분석기 바른입니다. 이런 한국어 NLP툴킷의 공개는 상업적이던 비상업적이던 늘 환영할 만한 것입니다. 우리나라의 NLP에 대한…

Posted in 미분류

Adsense의 GDPR 메세지 생성 요청

블로그에 애드센스를 붙이긴 했지만 수입이 거의 없기 때문에 접속을 자주 안합니다. 오랜만에 접속했더니 아래와 같은 경고 메세지가…

Posted in 미분류

Azure OpenAI API로 GPT 사용하는 예제

Azure cloud (애저 클라우드, 이하 Azure)에서 지원하는 OpenAI API로 GPT를 사용하는 방법입니다. OpenAI에서 제공하는 Python 클라이언트 패키지를…

Posted in 미분류

초거대 언어 모델이란? LLM

간단한 요약 정리 LLM LLM : Large Language Model의 약어로 한국어로 초거대 언어 모델이라고 합니다. Large라는 단어가…

Posted in 미분류

OpenAI API – GPT function calling 사용법

GPT function calling OpenAI의 GPT API에서 얼마전부터 새롭게 제공하는 function calling 기능에 대한 설명입니다. GPT function calling은…

Posted in 미분류

BigQuery로 최근접 이웃 구하기

BigQuery로 Consine similarity를 계산해서 최근접 이웃을 계산하는 예제 코드입니다. Cosine Distance함수는 BigQuery에서 빠른 것을 제공을 해주기 때문에…

Posted in 미분류

유용한 리눅스 커맨드 Linux Command List

리눅스 커맨드는 잘 배우면 간단한 작업을 즉시 하기에 매우 편리하고 좋지만 제대로 신경쓰지 않으면 좀처럼 익히기 쉽지…

Posted in 미분류

Database CTE (Common Table Expression)

SQL에는 쿼리를 실행할 때 그 순간만 사용할 테이블을 잠깐 만들어서 사용할 수 있습니다. 이때 JOIN절에서 임시 테이블을…

Posted in 미분류

Chatbot개발을 위한 KoAlpaca

Alpaca는 Facebook에서 공개한 LLama 모델을 스탠포드에서 개량한 것입니다. Alpaca에 한국어 학습데이터를 추가한 것이 KoAlpaca입니다. GPT API가 과금…

Posted in 미분류

Bigquery를 이용한 시퀀스(Sequence)데이터 처리 방법

시퀀스 데이터 프로세싱은 다음과 같은 문제가 있습니다. 기억해야 할 것 예제 준비중

Posted in 미분류

기계학습 경진대회에서 가장 많이 사용하는 도구들

잘 알려진 것이지만 정리해보면 이렇습니다.

Posted in 미분류

대학 전공서적, 기술서적 무료 다운로드 사이트 및 기타

LibGen(Library Gernesis)이라는 사이트에서 받으면 됩니다. 러시아 사이트인 것 같습니다. https://libgen.is/ Z=library도 유명합니다. https://z-lib.is/ 논문 받는 곳은 다들…

Posted in 미분류

PySpark lit 메쏘드

pyspark에서 .lit()는 문자열의 값을 모두 채워서 컬럼으로 만들어주는 메소드입니다. 다음과 같이 사용합니다. 더 자세한 것은 아래의 블로그를…

Posted in 미분류

ls: cannot open directory .: Stale file handle

ls: cannot open directory .: Stale file handle Linux에서 파일 목록을 확인하다가 위와 같은 오류가 보일 때가…

Posted in 미분류

Python으로 Click Prediction 모델 만들기

Click Prediction 모델 만들기 Click Prediction 모델은 사용자가 클릭할 가능성이 높은 광고를 예측하는 기계학습 모델을 말합니다. 광고…

Posted in 데이터과학 Data Science 데이터마이닝 Data mining 데이터분석 Data Analysis

매크로 평균(Macro-average)과 마이크로 평균(Micro-average)

머신 러닝 분야에서 평가 지표는 모델이 얼마나 잘 동작하는지를 측정하는 데 중요한 역할을 합니다. 이 중에서도 다중…

Posted in 미분류

round, ceil, floor, truncate의 차이

숫자를 다룰 때 가장 많이 사용하는 함수 들은 “floor”, “truncate”, “ceil”, “round”입니다. 이 함수들은 수학적인 개념을 기반으로…

Posted in 미분류

파이썬 커맨드라인 어플리케이션 패키지 – Python command-line packages

파이썬 커맨드라인 어플리케이션 패키지 커맨드라인 어플리케이션은 콘솔 어플리케이션 이라고도 합니다. 커맨드라인 어플리케이션은 텍스트 인터페이스로 사용하도록 설계된 컴퓨터 프로그램입니다. 쉘 이 그…

Posted in 미분류

아호코라식 Aho-corasick

Ahocorasick은 1975년에 Alfred V. Aho와 Margaret J. Corasick이 고안한 문자열 검색 알고리즘입니다. 입력 텍스트 내에서 유한한 문자열 집합(사전)의…

Posted in 미분류

Python FastAPI

Python의 FastAPI에 대한 소개입니다. FastAPI는 Python 3.6 이상으로 API를 빌드하기 위한 최신 고성능 웹 프레임워크입니다. FastAPI는 파이썬 표준…

Posted in 미분류

SQL의 DDL, DML, DCL

SQL의 DDL, DML, DCL에 대한 간략한 설명입니다. SQL은 Structured Query Language의 약자로, 데이터베이스에서 데이터를 정의하고 조작하고 제어하는…

Posted in 미분류

Python MySQL warning – Data truncated for column

Python MySQL을 쓰다가 다음과 같은 에러를 만날 때가 있습니다. Pandas의 데이터를 MySQL 테이블 넣거나 할 때 생기는…

Posted in 미분류

비용 이상감지 – Cost Anomaly Detection

비용이상감지 비용 이상감지는 이상감지를 비용과 밀접한 관련이 있는 데이터에 하는 것입니다. 이상감지는 시간에 따른 흐름과 추세의 패턴이…

Posted in 미분류

BigQuery: too many subqueries or query is too complex

BigQuery에서 with 구문을 많이 사용하거나 Sub query, Inline view를 과도하게 사용하면 나오는 오류입니다. 해결 방법 쿼리를 분할하거나…

Posted in 미분류

이상감지 – 랜덤컷포레스트 러스트 소스 Random Cut Forest Rust

랜덤컷포레스트 (Random Cut Forest)는 AWS에서 만든 이상감지모델입니다. 감지가 매우 정확한 편이지만 처리 속도가 매우 느린 알고리즘입니다. 랜덤컷포레스트의…

Posted in 미분류

ChatGPT

ChatGPT ChatGPT(챗GPT)는 채팅(대화)를 위해 만든 인공지능 소프트웨어입니다. 채팅을 위해 만든 GPT라는 뜻인데 GPT 모델은 인공지능 모델을 한…

Posted in 미분류

BigQuery How to extract domain from URL

If you want extract a domain from provided URL strings in BigQuery. It’s very easy. You can…

Posted in 미분류

MISCONF Redis is configured to save RDB snapshots, but it’s currently unable to persist to disk. Commands that may modify the data set are disabled, because this instance is configured to report errors during writes if RDB snapshotting fails (stop-writes-on-bgsave-error option). Please check the Redis logs for details about the RDB error.

다음과 같이 해결할 수도 있고 다음과 같이 해결할 수도 있다

Posted in 미분류

시계열데이터를 예측할 때 선형회귀(Linear Regression)를 사용하지 않는 이유

시계열 데이터 예측할 때 선형회귀를 안쓰는 이유? 시계열 데이터는 시간의 순서대로 측정된 데이터이기 때문에 시간에 따른 순서가…

Posted in 미분류

How to get current timezone on MySQL database

Posted in 미분류

MySQL 데이터베이스 타임존 확인 하는 법

타임존(timezone) 문제는 항상 골치가 아픕니다. 특히 데이터와 관련된 문제에서는 더욱 더 그렇고, 돈과 관련된 데이터라면 더더욱 문제가…

Posted in 미분류

신기한 Copilot 사용예 – 날짜목록 자동생성

오늘이 공휴일인지 아닌지 확인하는 간단한 코드를 Python으로 작성하는 것인데 이 예제에서 신기한 것은 Copilot이 주석의 내용을 보고…

Posted in 미분류

무료 책 – Introduction to Data Science – Data Analysis and Prediction Algorithms with R

데이터과학과 R을 배우기에 매우 좋은 온라인 무료 책입니다. 인쇄본은 유료입니다. 영어이지만 해석이 어렵지 않습니다. 하버드대하교에서 제공하는 것으로…

Posted in 미분류

딥러닝 초보를 위한 쉬운 설명 – Deep learning

딥러닝 (Deep Learning)의 쉬운 이해 딥러닝은 “깊은 학습”이라는 뜻이고 “심화학습”이라고 번역합니다만 원래 뜻과는 잘 안맞고 멋이 없어서…

Posted in 미분류

Selenium Grid 셀레니엄 그리드

셀레니엄(Selenium)은 웹서비스를 테스트하기 위해 사용하는 오래된 자동화도구입니다. 웹서비스를 테스트하기 위해서는 웹브라우저를 사람대신 작동하게 해서 접속하고 클릭하고 페이지를…

Posted in 마케팅 애드테크

Last Touch Attribution, LTA 모델

Last Touch Attribution은 광고 마케팅에서 사용하는 용어입니다. 데이터 기술로는 애드테크(Ad tech), 마테크(MarTech)에서 볼 수 있는 용어입니다. 번역할…

Posted in Python 리눅스 Linux 컴퓨터언어

ImportError: cannot import name ‘_psutil_linux’ from partially initialized module ‘psutil’

다음가 같은 에러가 주피터 랩(Jupyter lab)에서 나는 경우가 있습니다. ImportError: cannot import name ‘_psutil_linux’ from partially initialized…

Posted in 미분류

iframe안에 element를 querySelector로 선택하기

Javascript로 iframe안에 있는 element를 선택하려면 다음과 같이 하면 됩니다.

Posted in 미분류

ImportError: cannot import name ‘_psutil_linux’ from partially initialized module ‘psutil’ (most likely due to a circular import) (/usr/lib/python3/dist-packages/psutil/init.py)

다음과 같은 에러가 날 때가 있습니다. psutil을 다시 설치해주면 되는데 아마도 이미 설치되어 있다고 나올 것입니다. 다음과…

Posted in 미분류

단문 텍스트에 쓰기 적합한 형태소분석기

Posted in 미분류

모바일 게임에서 모바일 게임 광고가 많이 보이는 이유

게임 광고에 대한 분석을 하다 보면 종종 재밌는 사실을 알 수 있습니다. 그 중에 재밌는 것은 게임…

Posted in 미분류

CDP (Customer Data Platform) 고객 데이터 플랫폼은 무엇인가?

CDP의 정의 CDP는 디지털마케팅과 관련된 고객 데이터 관리 및 분석 플랫폼입니다. 여기서 말하는 고객 데이터는 주로 고객의…

Posted in 미분류

마크다운에 이미지 추가하기 add images in Markdown

링크 구문 앞에 느낌표!를 붙여주면 할 수 있습니다.하지만 크기 조정을 하려면 html태그를 직접 사용해야 합니다.

Posted in 미분류

차트와 그래프 시각화 가이드 Guided Visualizations for Charts and Graphs

인포그래픽스 – 차트와 그래프 시각화 가이드 출처: https://lnkd.in/e_AKDn9Y

Posted in 미분류

fatal error: gnutls/gnutls.h: No such file or directory

PyCuRL을 설치하다보면 이런 에러가 나올때가 있습니다. src/pycurl.h:206:13: fatal error: gnutls/gnutls.h: No such file or directory206 | #…

Posted in 미분류

은전한닢 MeCab Python 설치하기

메카브(MeCab)는 일본어 형태소분석기입니다. 은전한닢은 메카브를 한국어용으로 포팅한 것이고 Mecab-Ko 라고도 부릅니다. 은전한닢으로 텍스트마이닝, 자연어처리를 하거나 은전한닢에 의존성이…

Posted in 미분류

시간대에 따른 온라인 고객의 구매패턴 분석

시계열로 고객의 구매패턴을 확인하려면 많은 드릴다운과 데이터 탐색이 필요합니다. 하지만 간단한 특징으로 몇 가지 중요한 인사이트를 얻을…

Posted in 미분류

Ubuntu microk8s와 fluentd 설치하기

fluentd는 데이터 인제스쳔(Data ingestion) 레이어를 구성하는데 매우 유용한 도구입니다. fluentd를 microk8s로 구성하는 방법입니다. 우분투(Ubuntu)에 microk8s 설치하기 microk8s는…

Posted in 미분류

A/B 테스트를 하고도 잘못된 결정을 하는 이유

A/B 테스트를 한다고 하지만 정작 테스트 결과를 왜곡해서 해석하거나 자기가 해석하고 싶은대로 해석하는 경우가 많습니다. 오늘은 온라인…

Posted in 미분류

한국 회사들이 데이터 기반 의사결정에 실패하는 이유

데이터 기반으로 의사결정을 하는 것은 이미 전세계적으로 당연히 해야 할 것으로 다를 인지하고 있습니다. 하지만 많은 한국회사들은…

Posted in 미분류

R에서 Hashmap 사용하기

대부분의 컴퓨터언어에는 키로 값을 꺼내올 수 있는 자료구조인 hashmap을 제공합니다. Python에는 자료구조 딕셔너리 dictionary를 지원합니다. R에도 env라는…

Posted in 미분류

Confusion Matrix 혼동 행렬

Confusion Matrix(컨퓨전 매트릭스)는 한국어로 혼동행렬이라고 부릅니다. 혼동행렬이라는 단어가 어색해서 흔히 영어 발음 그대로 컨퓨전 매트릭스라고 부릅니다. Confusion…

Posted in 미분류

RFM 분석, RFM Analysis, 리테일 고객 분석하기

RFM에 대해서 간단하게 정리한 것을 올립니다. 더 복잡한 분석기법이나 모델링 방법은 다른 포스트에 올려보겠습니다. RFM 정의 RFM은…

Posted in 미분류

글을 쓰면 2D 일러스트레이션을 생성해 주는 – AI Stable Diffusion Demo

허핑페이스에 공개되었다고 합니다. 제목대로 영어로 생성할 이미지에 대한 설명을 적으면 생성을 해줍니다. 이런 종류의 AI는 이미 이전에도…

Posted in 미분류

Python MySQL 쿼리 결과를 dict로 가져오기 – Get dictionary from query result of MySQL

Python에서 MySQL의 DB결과를 가져올 때 cursor.fetchall()를 사용하면 MySQL결과는 보통 리스트(list) 타입으로 가져오게 되서 쿼리에서 선택한 컬럼의 번호를…

Posted in 미분류

LibLinear – 멀티코어 SVM 라이브러리 multicore SVM library

sVM 전통적으로 여전히 로버스트한 분류 문제를 해결하는데 쓰는 알고리즘입니다. 하지만 SVM의 문제점은 빌드된 모델이 왜 그렇게 만들어졌는지…

Posted in 미분류

기계학습 치트 시트 – Machine Learning Cheat Sheet

스탠포드에서 제공하는 기계학습 치트시트입니다. 요약 사전 같은 것입니다. 구성이 잘되어 있습니다. https://github.com/afshinea/stanford-cs-229-machine-learning

Posted in 미분류

간단한 기여도 계산 함수

기여도 기여도란 어떤 성과지표에서 어떤 부분집합이 전체의 성과지표에 얼마나 형향을 주었는지 계산하는 것입니다. 리프트(lift)라고도 합니다. 리프트는 알고리즘이나…

Posted in 미분류

matplotlib cheat sheet

Python에서가장 많이 쓰는 시각화 라이브러리는 matplotlb입니다. 역사가 깊고 좋지만 학습장벽이 조금 높은 편입니다. matplotlib의 사용법을 pdf로 예쁘게…

Posted in 미분류

골 프로그래밍 – Goal Programming with Excel

골 프로그래밍은 제목만 봐서는 직감적으로 알기 어려울 수 있습니다.최대한 목표에 가깜게 하는 조건을 찾아주는 선형최적화 방법입니다.원래는 프로그래밍이나…

Posted in 미분류

CTR이 높고 CVR이 낮은 것과 CTR이 낮고 CVR이 높은 것 중 어느 것이 좋은가?

광고 캠페인을 운영하다보면 비슷한 또는 동일한 캠페인인데 매체 또는 DSP업체 성과가 다음과 같이 다른 경우가 있습니다. CTR은…

Posted in 미분류

쉽게 이해하는 XGboost

요약 XGboost는 기계학습에서 사용하는 결정 트리(Decision Tree)라는 계열의 알고리즘 중 하나입니다. 중요한 특징으로는 분산 컴퓨팅으로 기계학습 모델을…

Posted in 미분류

LightGBM

LightGBM은 결정 트리(Decision Tree) 계열의 알고리즘 중에서는 현재까지의 가장 좋은 알고리즘입니다. 그렇다고 해서 이 알고리즘이 xgboost나 gbdt에…

Posted in Python 리눅스 Linux

Centos에 C++을 위한 build-essential 설치하기

Python 패키지 중에는 설치할 때 C++ 작성된 코어 모듈을 컴파일해서 설치하는 것들이 종종있습니다. 이런 것을 설치하려면 C++…

Posted in 데이터과학 Data Science 마케팅 알고리즘 Algorithm 애드테크 인공지능, 기계학습 ML/AI 통계

MAB (Multi Armed Bandit) – 광고 플랫폼의 캠페인 노출 최적화

엠에이비, 멀리암드밴딧이라고 부릅니다. “팔 여러 개 달린 산적” “Multi Armed Bandit”은 슬롯머신의 별명입니다. 이름처럼 “어떤 슬롯 머신의…

Posted in 데이터분석 Data Analysis

티스토리(Tistory) 카테고리 체계

카카오(옜날 다음)에서 운영하는 블로그 플랫폼 티스토리에는 간단한 카테고리가 체계가 있습니다. 이 카테고리 체계는 블로거별로 설정을 하게 되어…

Posted in Python

pycurl 윈도우 버전 설치하기 – install pycurl on Windows

Python 패키지 중에는 설치할 때 C/C++ 소스를 빌드해서 설치하는 것들이 있는데 이런 패키지들은 Windows에서 설치할 때 잘…

Posted in Python

sys.meta_path is None, Python is likely shutting down

이 에러는 셀레니엄(Selenium)에서 나는 에러입니다. 셀레니엄이 확실하게 종료되고 있는데 명령을 준 경우입니다. 셀레니엄을 quit한 후에 확실하게 몇초…

Posted in Python

descriptor ‘seek’ for ‘_io.BytesIO’ objects doesn’t apply to a ‘int’ object

이 에러는 Python2나 구버전의 Python에서 StringsIo를 truncate할 때 발생하는 오류입니다. BytesIO와 StringsIo는 구버전에서는 포지셔 이동없이 truncate가 가능했습니다….

Posted in R 소식

R언어 개발툴 제작사 Rstudio 회사이름을 Posit으로 변경하다

Rstudio는 R언어 개발툴 이름이며 제작사의 이름이기도 합니다. Rstudio에는 R언어의 고수들이 모여 있는 많은 데이터과학자 겸 개발자들로 구성된…

Posted in 리눅스 Linux

Ubuntu 22.04에 Jenkins 설치하기

Ubuntu 22.04에 Jenkins를 설치하면 실행이 잘 안됩니다. 우분투 22.04는 최신 LTS 버전이라서 정말 쉽게 되야 할텐데 이상하죠?…

Posted in 미분류

메타 (페이스북, 인스타그램)이 정보제공동의 서명을 받는 이유에 대해서

페이스북, 인스타그램은 메타의 소유입니다. 메타는 페이스북이 회사명을 바꾼것이구요. 메타가 최근 자사의 소셜플랫폼에서 사용자에게 정보제공동의 서명을 받고 있습니다….

Posted in 미분류

npm WARN This failure might be due to the use of legacy binary “node”

npm run start를 했을 때 나올 수 있는 에러입니다. 해결 방법은 npm으로 모듈을 설치할 때 옵션을 주고…

Posted in 미분류

윈도우에서 폰트의 영문 이름 알아내기 – Finding the name of the English font in a TTF file

영문처리만 지원하는 소프트웨어에서 폰트를 사용하기 위해서는 TTF 파일 또는 OTF 파일의 영문 이름을 알아야 하는 경우가 있습니다….

Posted in 미분류

리타겟팅(Retargeting) 나를 계속 따라다니는 광고

온라인 광고 기법 중에 리타겟팅(ReTargeting)이라는 것이 있습니다. 움직이는 타겟을 따라다닌다는 말인데 여기서 타겟은 인터넷 사용자를 말합니다. 자신이…

Posted in 미분류

Get “https://registry-1.docker.io/v2/”: proxyconnect tcp: tls: first record does not look like a TLS handshake

docker build를 하던 중에 이런 오류가 날 때가 있다. 서버가 방화벽 안쪽에 있고 외부 네트워크로 나가기 위해서는…

Posted in 미분류

sudo: add-apt-repository: command not found

Ubuntu에서 패키지를 설치하다보면 패키지를 받아야 할 레파지토리를 추가해줘야 하는다 그때 add-apt-repository를 사용합니다. 그런데 제목과 같이 에러가 발생하는…

Posted in 미분류

Ubuntu에서 Aerospike 제거 방법

Aerospike는 추가, 삭제가 빠른 SSD기반의 대용량 데이터를 처리할 수 있는 NoSQL입니다. Schemaless(스키마 없는) NoSQL이라고 하지만 Schema의 변경이…

Posted in 검색엔진 Search Engine

엘라스틱서치 필드값으로 집계하기 ElasticSearch Aggregation Query (group by)

ElasticSearch는 RDMS가 아닙니다. DB가 아닙니다. 넓은 의미로는 데이터베이스라고 할 수는 있습니다. 데이터를 넣고 분석하고 삭제하는 등의 관리를…

Posted in 리눅스 Linux

tcpdump로 UDP 데이터가 어느 호스트에서 오는지 확인하는 법

제목 그대로입니다. UDP는 TCP와 달리 커넥션(connection)을 맞는 방식이 아니기 때문에 바로 지금 데이터를 보내는 호스트들이 어떤 것인지…

Posted in 미분류

Failure –
java.io.IOException: Downloaded file /var/lib/jenkins/plugins/workflow-support.jpi.tmp does not match expected SHA-1

젠킨스 플러그인 업데이트 도중에 다음과 같이 에러가 발생할 때 해결하는 방법이다. 플러그인 업데이트 주소를 아래와 같이 지정해준다.

Posted in 미분류

The following signatures couldn’t be verified because the public key is not available: NO_PUBKEY xxxxxxxxxxxxxxxx

우분투에서 apt로 레파지토리를 등록하고 설치를 할 때 이런 에러가 발생할 때가 있다. 특히 Jenkins 키 등록을 못한…

Posted in Python

파이썬 한글 자모 분리 패키지

한글 자모분리를 하는 것은 오타처리, 스팸 감지, 욕설, 성적 표현을 주는 키워드 감지 같은 것을 하기 위해서…

Posted in 미분류

우분투에 Mecab 형태소분석기 설치 – Install Mecab in Ubuntu

우분투에 Mecab(은전한닢) 형태소 분석기를 설치하는 방법입니다. Mecab 메카브 간략 설명 Mecab를 간단히 설명하면 Mecab은 C++로 만든 일본어…

Posted in 리눅스 Linux

E: Unmet dependencies. Try ‘apt-get -f install’ with no packages (or specify a solution).

우분투에서 패키지를 설치하다가 의존성이 깨지거나 하게 되면 그 뒤로 apt를 실행할 때 마다 에러가 발생합니다. 여간해서는 해결이…

Posted in 미분류

[Jenkins] Could not initialize class org.eclipse.jgit.internal.storage.file.FileSnapshot

젠킨스로 git repository를 polling해서 코드가 푸시되었는지 확인한 후에 자동 빌드하는 프로세스를 만들면 로그에 이런 에러가 나면서 실패하는…