[문제 설명]
지도개발팀에서 근무하는 제이지는 지도에서 도시 이름을 검색하면 해당 도시와 관련된 맛집 게시물들을 데이터베이스에서 읽어 보여주는 서비스를 개발하고 있다.
이 프로그램의 테스팅 업무를 담당하고 있는 어피치는 서비스를 오픈하기 전 각 로직에 대한 성능 측정을 수행하였는데, 제이지가 작성한 부분 중 데이터베이스에서 게시물을 가져오는 부분의 실행시간이 너무 오래 걸린다는 것을 알게 되었다.
어피치는 제이지에게 해당 로직을 개선하라고 닦달하기 시작하였고, 제이지는 DB 캐시를 적용하여 성능 개선을 시도하고 있지만 캐시 크기를 얼마로 해야 효율적인지 몰라 난감한 상황이다.
어피치에게 시달리는 제이지를 도와, DB 캐시를 적용할 때 캐시 크기에 따른 실행시간 측정 프로그램을 작성하시오.
입력 형식
- 캐시 크기(cacheSize)와 도시이름 배열(cities)을 입력받는다.
- cacheSize는 정수이며, 범위는 0 ≦ cacheSize ≦ 30 이다.
- cities는 도시 이름으로 이뤄진 문자열 배열로, 최대 도시 수는 100,000개이다.
- 각 도시 이름은 공백, 숫자, 특수문자 등이 없는 영문자로 구성되며, 대소문자 구분을 하지 않는다. 도시 이름은 최대 20자로 이루어져 있다.
출력 형식
- 입력된 도시이름 배열을 순서대로 처리할 때, "총 실행시간"을 출력한다.
조건
- 캐시 교체 알고리즘은 LRU(Least Recently Used)를 사용한다.
- cache hit일 경우 실행시간은 1이다.
- cache miss일 경우 실행시간은 5이다.
입출력 예제
캐시크기(cacheSize) | 도시이름(cities) | 실행시간 |
3 | ["Jeju", "Pangyo", "Seoul", "NewYork", "LA", "Jeju", "Pangyo", "Seoul", "NewYork", "LA"] | 50 |
3 | ["Jeju", "Pangyo", "Seoul", "Jeju", "Pangyo", "Seoul", "Jeju", "Pangyo", "Seoul"] | 21 |
2 | ["Jeju", "Pangyo", "Seoul", "NewYork", "LA", "SanFrancisco", "Seoul", "Rome", "Paris", "Jeju", "NewYork", "Rome"] | 60 |
5 | ["Jeju", "Pangyo", "Seoul", "NewYork", "LA", "SanFrancisco", "Seoul", "Rome", "Paris", "Jeju", "NewYork", "Rome"] | 52 |
2 | ["Jeju", "Pangyo", "NewYork", "newyork"] | 16 |
0 | ["Jeju", "Pangyo", "Seoul", "NewYork", "LA"] | 25 |
[문제 풀이]
캐시의 사용 목적은 주로 컴퓨터의 성능 향상에 있다.
필요한 데이터를 뽑아올때 매번 메인 메모리나 데이터베이스 등에 접근하면 그만큼 효율성이 떨어지기에
한번 접근할때 캐시 사이즈만큼 한번에 가져오고 다음에 필요한 데이터를 뽑아올때 캐시부터 먼저 확인해서 좀 더 효율적으로 성능 향상을 하기 위한 방법이다.
만약 찾으려던 데이터가 캐시에 있다면 문제 조건에 적혀있는 cache hit 상황이고,
없다면 cache miss 상황이라고 얘기 할 수 있다.
간단하게 일상에서의 예를 들때 캐시를 지갑으로 비유한다.
현금이 필요할 경우 지갑이 없다면 필요할때마다 ATM으로 가서 현금을 뽑아와야 할 것이다.
만약 지갑이 있다면 ATM에서 필요한 것 이상으로 뽑아서 지갑에 넣어놓으면 다음에 돈이 필요할땐 지갑에서 바로 쓸 수 있다는 점을 예로 들 수 있다.
캐시 교체하는 알고리즘은 여러가지가 있다
문제에서 얘기하는 LRU(Least Rcently Used) 알고리즘은 간단하다.
캐시에 저장된 데이터의 양이 cache사이즈를 넘어갈 경우, 가장 오랫동안 사용되지 않은 데이터부터 캐시에서 삭제하는 방법을 이야기한다.
이 부분은 앞뒤로 삽입이 가능한 list나 deque를 사용하여 구현하면 편하다.
문제를 풀기전 예외처리가 필요하다.
조건에 보면 cacheSize의 값이 0부터 시작된다.
이때는 전달받은 cities의 사이즈에 cache miss의 실행시간인 5s를 곱한 후에 return하면 된다.
문제 풀이는 아래와 같다.
1. cities vector를 순회하면서 각 도시가 cache에 있는지 체크한다.
=> 이때 각 도시의 이름은 대소문자 구분을 하지 않기에 lowerCase로 통일하려고 했다. (*upperCase로 통일해도 무관)
변경하기위해선 transform 함수를 사용하면 된다.
2. 만약 cache에 해당 도시가 있다면 지우고, 동일한 도시를 다시 삽입해준다. answer값을 1(cache hit) 증가시킨다.
=> 이렇게 하는 이유는 LRU알고리즘을 위해 가장 오래 사용되지 않은 도시 순서대로 cache의 맨 앞에 부터 위치 하게 하 기 위해서이다.
3.cache에 해당 도시가 없다면, cache에 넣어준다. cache에 넣기 전에 cache 사이즈가 입력으로 받은 cacheSize와 같아졌다면 더이상 cache에 공간이 없는것이므로 cache의 맨 앞에 있는 데이터를 지워준다. pop_front와 같은 함수를 이용하면 된다. answer 값을 5(cache miss) 증가시킨다.
4. 모든 도시를 순회할때까지 1-3번을 반복한다.
[코드]
[GitHub]
코드가 깨끗하고 명확하게 보일진 모르겠지만, 누군가에게 도움이 될 수도.. 있기에..
#include <string>
#include <vector>
#include <deque>
#include <algorithm>
using namespace std;
int solution(int cacheSize, vector<string> cities) {
int answer = 0;
int citiesSize = cities.size();
if(cacheSize == 0)
return citiesSize * 5;
deque<string> cache;
for(int i =0; i < citiesSize; i++)
{
transform(cities[i].begin(), cities[i].end(), cities [i].begin(), ::tolower);
int current_cacheSize = cache.size();
int findIdx = -1;
for(int j = 0; j < current_cacheSize; j++)
{
if(cache[j] == cities[i])
{
findIdx = j;
break;
}
}
if(findIdx != -1)
{
answer+=1;
cache.erase(cache.begin() + findIdx);
}
else
{
if(current_cacheSize == cacheSize)
{
cache.pop_front();
}
answer+=5;
}
cache.emplace_back(cities[i]);
}
return answer;
}
'Problem Solving > 프로그래머스' 카테고리의 다른 글
[프로그래머스] - 전력망 둘로 나누기(C/C++) (0) | 2022.12.14 |
---|---|
[프로그래머스] - 더 맵게(C/C++) (0) | 2022.12.13 |
[프로그래머스] - 디펜스 게임(C/C++) (0) | 2022.12.09 |
[프로그래머스] - N-Queen(C/C++) (1) | 2022.12.08 |
[프로그래머스] - 과일 장수(C/C++) (0) | 2022.12.07 |