전체 글 40

강화학습의 이해

강화학습이란?강화학습(Reinforcement Learning, RL)은 에이전트가 주어진 환경 안에서 상태를 인식하고, 가능한 여러 행동들 중에서 보상을 최대화할 수 있는 행동을 선택하는 학습 방법입니다. 이 방식은 에이전트가 랜덤하게 행동을 수행한 후, 그 행동에 대해 보상(reward)이나 페널티를 받으면서 학습이 이루어집니다. 결국, 에이전트는 보상을 최대화하는 행동을 찾도록 모델이 학습됩니다. 강화 학습 - 위키백과, 우리 모두의 백과사전 강화학습의 구성 요소강화학습에서 중요한 요소는 상태(state), 행동(action), 그리고 **보상(reward)**입니다. 에이전트는 주어진 환경에서 각 시간 단계마다 상태를 인식하고, 그에 맞는 행동을 선택합니다. 그 후, 선택한 행동에 대해 보상을 받..

인공지능 2025.01.26

[졸업 프로젝트] 프로젝트 첫 발자취 2: 모델 설계

이전 포스팅- [Starprint] 프로젝트 첫 발자취 1: Starlink & Website Fingerprinting [Starprint] 프로젝트 첫 발자취 1: Starlink & Website FingerprintingStarlink란?한때, 일론 머스크가 어마무시한 규모로 우주선을 쏘아 올린 적이 있었습니다.단순히 SpaceX의 실험으로 보일 수도 있었으나,사실 그 안에는 Starlink 위성이 포함되어 있었습니다. 스타링blog-501b-21207b.tistory.com 앞선 포스팅에서 스타링크와 Website Fingerprinting(WF)에 대해 간략히 소개했습니다.이번 포스팅에서는 저희 팀이 진행 중인 프로젝트 설계에 대해 구체적으로 이야기해보고자 합니다.Website Fingerpr..

프로젝트 2024.11.26

[졸업 프로젝트] 프로젝트 첫 발자취 1: Starlink & Website Fingerprinting

Starlink란?한때, 일론 머스크가 어마무시한 규모로 우주선을 쏘아 올린 적이 있었습니다.단순히 SpaceX의 실험으로 보일 수도 있었으나,사실 그 안에는 Starlink 위성이 포함되어 있었습니다. 스타링크(Starlink)는 SpaceX에서 개발한 위성 인터넷망이자 사업체의 이름으로,6G 시대의 핵심 기술 중 하나로 손꼽히고 있습니다.지하 혹은 해저 광케이블을 통해, 즉 유선을 통해 네트워크 패킷이 전송되던 기존 인터넷과는 달리,스타링크는 지상 기지국(Ground Station, GS)으로부터 저궤도(LEO) 위성으로 패킷을 전송하는 방식으로 통신이 이루어집니다.이미 미국, 유럽, 일본 등 여러 국가에서 서비스가 실시되었으며,우리나라에서도 현재 서비스 시작을 앞두고 있습니다. 6G 시대의 선두주자..

프로젝트 2024.11.26

[나홀로 파리 2일차] Cité Universitaire으로

14시간 비행의 여파로 저녁 6시에 잠든 바람에 새벽 3시에 깼다. 여기가 파리가 맞나... 침대에서 뒹굴거리다가 그제서야 씻고 8시에 조식을 먹으러 나갔다. 토스트도 해먹을 수 있는 것 같은데 재료가 다 떨어졌길래 그냥 있는 빵 몇 개 집어 들었다. 근데...겁나 맛있엇다. 이게 조식이라고??? 한국 파리 바게트보다 훨씬 맛있다. 원래는 오렌지 주스를 마시려고 했는데 그것도 다 떨어져서 사과 주스를 먹었는데 인생에서 가장 맛있는 주스였다. 조식 최고😭😭 기숙사 체크인은 3시부터였어서 나는 농땡이를 피워야 했다. 12시 체크아웃에 맞춰 체크아웃하고 우버를 부르려는데 그때부터 데이터가 안 잡히기 시작했다^^ 찾아보니 쓰리심이 프랑스에서는 잘 안된다고 한다.....왜?ㅜ 당황해서 어쩔 줄 모르다가 호텔 와이..

일기 2023.07.03

[나홀로 파리 1일차] 인천에서 파리까지

새벽 4시 반, 인천공항 근처 한 숙소에서 잠에서 일어났다. 나는 그날 9시 비행기를 타고 출국해야했기 때문에 6시에 공항에 도착하는 걸 목표로 부랴부랴 준비하고 호텔을 나섰다. 5시 반 경 택시를 타고 공항에 도착하자 꽤 사람이 많았다. 아니 왜...? 그시간에도 사람이 그리 많은지...? 난 표가 없어서 9시 비행기를 끊었다지만...다들 부지런하군아... 아무튼 엄마랑 만나서 짐 정리하고 체크인하고 짐도 맡기고 엄마랑 마지막으로 공항에서 밥도 먹고 카페에서 담소를 나눈 뒤, 나는 출국장으로 떠났다. 게이트가 출발 40분 전에 열린다길래 적당히 1시간 전에 들어갔는데 기내 수하물 검사도 하고 출국 심사도 하느라 시간이 꽤 걸렸다. 출국 준비를 무사히 마치고 비행기에 올라탔다. 나는 대한항공이 공동운항하..

일기 2023.07.03

[Python3] 백준 1149 - RGB거리

1149번: RGB거리 첫째 줄에 집의 수 N(2 ≤ N ≤ 1,000)이 주어진다. 둘째 줄부터 N개의 줄에는 각 집을 빨강, 초록, 파랑으로 칠하는 비용이 1번 집부터 한 줄에 하나씩 주어진다. 집을 칠하는 비용은 1,000보다 작거나 www.acmicpc.net 문제 설명 RGB거리에는 집이 N개 있다. 거리는 선분으로 나타낼 수 있고, 1번 집부터 N번 집이 순서대로 있다. 집은 빨강, 초록, 파랑 중 하나의 색으로 칠해야 한다. 각각의 집을 빨강, 초록, 파랑으로 칠하는 비용이 주어졌을 때, 아래 규칙을 만족하면서 모든 집을 칠하는 비용의 최솟값을 구해보자. 1번 집의 색은 2번 집의 색과 같지 않아야 한다. N번 집의 색은 N-1번 집의 색과 같지 않아야 한다. i(2 ≤ i ≤ N-1)번 집..

알고리즘 2022.03.03

[Python3] 백준 2877 - 4와 7

2877번: 4와 7 창영이는 4와 7로 이루어진 수를 좋아한다. 창영이가 좋아하는 수 중에 K번째 작은 수를 구해 출력하는 프로그램을 작성하시오. www.acmicpc.net 문제 설명 문제 창영이는 4와 7로 이루어진 수를 좋아한다. 창영이가 좋아하는 수 중에 K번째 작은 수를 구해 출력하는 프로그램을 작성하시오. 입력 첫째 줄에 K(1 ≤ K ≤ 109)가 주어진다. 출력 첫째 줄에 창영이가 좋아하는 숫자 중 K번째 작은 수를 출력한다. 알고리즘 분류 수학 구현 풀이 방법 출력되는 숫자를 차례대로 살펴보면 첫번째 숫자는 4, 두번째는 7, 세번째는 44, 네번째는 47, 5번째는 74, 6번째는 77, … 이진수와 비슷한 느낌을 받을 수 있다. N 길이 출력 이진수 십진수 1 $$ N\le2^1 $..

알고리즘 2022.03.02

[Do it! 딥러닝 입문 리뷰] 6장. 2개의 층을 연결합니다 - 다층 신경망

Google Colaboratory Notebook Run, share, and edit Python notebooks colab.research.google.com 06-1. 신경망 알고리즘을 벡터화하여 한 번에 전체 샘플을 사용합니다 벡터화된 연산은 알고리즘의 성능을 올립니다 배치 경사 하강법으로 성능을 올립니다 확률적 경사하강법: 알고리즘을 1번 반복할 때 1개의 샘플을 사용 손실 함수의 전역 최솟값을 불안정하게 찾음 선형 회귀, 로지스틱 회귀 배치 경사하강법: 가중치를 1번 업데이트 할 때 전체 샘플 사용 손실 함수의 전역 최숫값을 안정적으로 찾음 알고리즘 1번 수행당 계산 비용 ↑ 벡터 연산과 행렬 연산을 알아봅니다 점 곱(dot product, scalar product, 스칼라 곱) $z=x..

인공지능 2022.02.21